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JO (57) Abstract: The invention relates to a cell element field for data processing with function cell for carrying out algebraic and/or 
logical functions and memory cells for the receipt, storage or giving out of information. Pertaining to the above, a control connection 
f^) is run from the function cells to the memory cells. 

O ( 57 ) Zusammenfassung: Die Erfindung betrifft ein Zellementefeld zur Datenverarbeitung mit Funktionszellen zur AusfUhrung al- 
gebraischer und/oder logischer Funktionen und Speicherzellen, urn Information zu empfangen, abznspeichern und/oder auszugeben. 
1^" Hierbei ist vorgesehen dass von den Funktionszellen eine Steuerverbindung zu den Speicherzellen gefuhrt ist. 
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Titel: Rekonf igur i erbar e Elemente 

15 



Def initionen 

20 Rekonf iguri erbar e Elemente werden abhangig von der auszufuhrenden Application 
unterschiedlich und applikationsentsprechend ausgestaltet . 

Die Aufgabe der Erfindung besteht darin, Neues fur die gewerbliche Anwendung 
berei tzustellen . 

25 

Die L&sung der Aufgabe wird unabhangig beansprucht . Bevorzugte 
Ausftthrungsformen finden sich in den Unteransprttchen . 

Unter einer rekonfiguri erbar en Architektur werden vorliegend Bausteine (VPU) 
30 mit konf igurierbarer Funk t ion und/oder Vemetzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- oder mehrdimens i onal 
angeordneten arithmetischen und/ oder logischen und/oder analogen und /oder 
speichernden und/oder intern/extern vemetzenden Baugruppen, die direkt oder 
durch ein Bus system miteinander verbunden sind. . 

35 

Zur Gattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (10), 
Verne tzungs- und Wetzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc. . 

Hingewiesen wird insbesondere in diesem Zusammenhang auf die f olgenden 
Schutzrechte und Anmeldungen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 
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07 872.2 , DE 101 39 170.6 , DE 199 26 538.0 , DK 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 

5 Offenbarungszwecken vollumf anglich eingegliedert. 

Die o.g. Architektur wird beispielhaft zur Verdeutlichuag herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Veraetzungszellen 

10 und/oder koramunikativen/peripheren (10) Zellen (PAEs), die zu einer ein- Oder 
mehrdimensionalen Matrix (PA) angeordnet sein konnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussysteme werden dabei als Zellen verstanden. Der Matrix als ganzes Oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT, Ladelogik) , die 

15 die Vernetzung und Funktion des PA konf igurier t . Die CT kann z. B. als 

dedizierte Einheit gem. PACT05, PACT10, PACT17, ausgestaltet sein Oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soil auf die bekannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Dmfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeHuon), KressArrays (Kress, Ttoi Kaiserslautern), XPOTER (Hartenstein, Uni 
30 Kaiserslautern) , sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erwei t erungen , die fur alle vorgenannten 
Strukturen nutzbar sind, verbessern die Nutzbarkeit der Architektur en und 
PAE-Strukturen in komplexen insbesondere auch stark sequent! ell en und/oder 
35 wenig datenfluSorientierten Anwendungen. Weiterhin wird der AnschluS an 
exteme Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogenisiert . 



Indirekte Konf iguration 

In einer besonderen Ausftthrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (RRAM) , vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist ein en eigenen intemen Sequenzer auf oder ist mit einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limitierten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mOglichen Befehlen, 
ahnlich wie bei RISC-Prozessozren und/oder bevorzugt vollstandigen 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Worten wird 
bevorzugt ein RISC Prozessor mit einem roBglichst kleinen Befehlssatz, der 
jedoch berechnungstheoretisch vollstandig ist, verwendet. In einer 
Aus fuhrungsvari ante kann der Sequenzer auch durch eine Konf iguration einer 
5 oder mehrerer PAEs gebildet werden. Es kann der Sequenzer in seiner Funktion 
und seinem Abl au f verhal ten konf igurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera [ALTERA Data Book 1993]). Der Sequenzer /Microcontroller kann auf 
Zustande (z.B. Statussignale , Ereignisse) in der IPAE und/oder auf Zustande 

10 (z.B. auch Trigger) anderer PAEs, die rait der IPAE verbunden sind (z.B. ttber 
ein Bussystem) , reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konf iguriert , z. B. kann der ProgramPointer Rpp 
kann wahrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer referenzierten 

15 Speicherinhalt aus dem RRAM und schreibt dies en (oder einen Teil des sen) 
entweder in ein, beispielsweise durch den Speicherinhalt adressiertes, 
Konf igurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion fur eine nSchste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der ttblichen Arbeit sweise von Adresspointem 

20 inkrementiert und/oder dekrementiert und/oder bei Sprungbefehlen (JUMP, CALL, 
RETURN) neu gesetzt. Ins owe it stellt der Speicher RRAM einen Codespeicher und 
in einer bevorzugt en Ausfuhrung auch Datenspeicher fur einen Sequenzer zur 
Verfugung und/oder wird ais solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten Ausfuhrung auch Da ten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofern stellt der 
Speicher auch einen Datenspeicher fur den Sequenzer dar. 

Der RRAM Speicherinhalt kann von einer ttbergeordneten Konf igurationseinheit 
(CT) geladen werden. In einer erwe iter ten Ausfuhrung kann der Speicherinhalt, 
30 ggf . auch von der IPAE selbstandig, zusatzlich oder alternativ aus einem 

anderen (beispielsweise extemen) Speicher geladen oder an diesen geschrieben 
werden, z.B. ttber einen Anschlufi an ein Front end. 

In einer Ausfuhrungsvariante kann der Speicher und/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein extemes RAM und/oder exteme 10 besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kann der EXTBUS ttber eine, 
ggf. dedizierte, Verbindung des PAE- Bus sy s terns an eine Interface-Baugruppe 
(IOAG) wie beispielsweise aus PACT 03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von Speicher (RAM) und/oder Peripherie (IO) erfolgt dabei 
40 bevorzugt durch die Interface-Baugruppe. 

In einer besonders bevorzugten Ausgestaltung kann der RRAM selbstandig Code 
und/oder Daten fur den Sequenzer ttber den EXTBUS aus dem oder einem extemen 
RAM laden. Diese Funktion kann durch eigenstandige, im RRAM implementierte 
45 oder implement ierbare Adressgenerator en realisiert werden. Beispielsweise 

eignen sich DMA-Kontroller besonders fttr diese Aufgabe, indem sie blockweise 
Daten zwischen den Speichern kopieren. Der Adressraum der zu lesenden Daten 



WO 03/036507 



PCT/EP02/10572 



und der Zieladressraum wird entsprechend gesetzt und der Kop i ervorgang wird 
gestartet. Das Setzen kann durch die IPAE erfolgen. 

In einer hardwar emaSi g aufwendigeren Lfisung kann die Function durch eine 
5 implementierte MemoryManagemenUni t (MMU) realisiert sein, deren allgemeine 
Funktionsweise durch den Stand der Technik per se definiert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMD hier wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages > 
10 aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes innerhalb 
eines extern en Speichers. Bei spielsweise kC5nnen die hexadezimalen RRAM- 
Adressen OxOaOO. .OxOaff Daten des externen Speichers an den Adressen 
Oxbdl3200. .0xbdl32ff en thai ten. Zur Verwaltung der Adressumsetzung wird eine 
AdressObersetzungseinheit verwendet, die vorzugsweise durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die MMD ist nun dazu 

vorgesehen, insbesondere einen gro&en Speicherraum auf den sehr viel 
Kleiner en des RRAM zu ttbersetzen. Dies geschieht vorliegend der art, dass 
Seiten je nach Bedarf von dem gro&en Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht raehr benetigt wird, kann diese gelOscht 
20 und /oder Oberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wird die Seite bevorzugt vor dem LOschen/Oberschreiben in den groSen 
Speicherrraum zurQckgeschri eben . 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hGherwertiger Teil 
25 der phys ileal ischen Adresse (also die Adresse der Seite) in dem Lookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 

zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 

Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 

auch keine Refer enz eingetragen. In diesem Pall muss die Seite erst von 
30 einem groSen (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann 

eine andere, bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden 

Ablauf Oberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der MMD* ein DMA-Kontroller 

angesteuert wird. Die erfindungsgemaSe MMD des hier offenbarten RRAM ist 
daher mit einer Ansteuerung fur einen DMA-Kon troll er versehen und/ Oder 
verbindbar. Diesem werden die entsprechenden Sei ten adressen im RRAM und 
externen RAM, sowie die SeitengrOfie durch die MMU zur Verftigung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 

In einer moglichen und applikationsabhangig ggf . bevorzugt en Ausfuhrung 
kdnnen mehrere EXTBUS -Interface implementiert sein. 

45 

In einer moglichen Ausfuhrung ist der RRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kOnnen 
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beispielsweise ftlr einige der folgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein land insbesondere eine Grd&e aufweisen, die. die 
Implementierung aller oder einiger der folgenden Funktionen ermSglicht sowie 
entsprechende Steuerungen, die gegebenenf alls konf igurierbar sind, bevorzugt 

5 aber fest implementiert sind, besitzen: 

Sequenzer- /Code- Speicher, Stack (z.B. ftlr Regis tersatz) , Datenspeicher, Heap, 
10- Puffer, Puffer zu extern em RAM bzw. Cache, Lookup-Tabellen , 
Konfigurationen fur PAEs und/oder Busse, der Registersatz der IPAE. 
Je nach Funk t ion kSnnen dazu folgende Ansteuermechanismen vorgesehen und/oder 

10 konfiguriert sein: 

Sequenzer- /Code- Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rap) , 
gegebenenf alls auch ein FramePo inter (Rfp) , wie er nach dem Stand der Technik 
15 (z. B. Intel Pentium) per se bekannt ist. 

Konfigurationen fur PAEs und/oder Busse:- Hierauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innerhalb der 
Konf igur at ions s teuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
20 untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardwar etechni sch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche , wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Compiler oder Programmierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszufuhrende 
Programm und/oder Be tr i ebssys tern und wird innerhalb des Programmes und/oder 
Betriebssystems, ggf . unter Zuhilf enahme der Regis tersatzes und der ALU des 
Sequenzers, berechnet. 



30 Der Registersatz der IPAE kann in einer besonderen Ausgestaltung ahnlich dem 
Registersatz von Transputem als Stack organlsiert sein. Dadurch kann der 
Registersatz besonders klein und hardware technisch effizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputer technologic bekannt, dass Compiler effizient mit einem 

35 derartigen hardwaretechnisch kostengtinstigen Registersatz arbeiten kfinnen. 
Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer Ausftthrung kann und wird der RRAM als Multi-Port Speicher ausgeftthrt 
sein. Multi-Port Speicher erlauben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicher zugr if fseinheiten auf den 
Speicherinhalt. Speicherzugrif fseinheiten ktinnen beispielsweise externe 
und/oder interne Peripherie, Prozessoren, andere PABs sein. Die Funktion von 
Multi-Port Speichem ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen AusfOhrung kann die IPAE mit dem RRAM als lokale und ggf. 
auch global e Konf igurations einhei t ahnlich einer CT fur PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erftillen. Bevorzugt arbeitet 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konfigurationseinheit. Wird die PAE ale global e 
Konfigurationseinheit verwendet, Oder sind sehr vielelokale PAEs zu 
konfigurieren, wird bevorzugt das Verfahren nach DE 196 54 593.5-53 

5 verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele und 
auch voneinander unabhangige Konf igurationen verwal ten kann. 
Die IPAE adressiert, z. B. geeteuert durch den Sequenzer/ Microcontroller, 
Konf igurationen im RRAM und konfiguriert diese an PAEs und/oder sich selbst 
und /oder bestimmt den Ablauf des Sequenzer s /Microcontrollers . Bevorzugt 

10 f indet hierbei eine Synchronisation mit einer Qbergeordneten CT ahnlich der 
bekannte Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RRAM Schaltung kann Konf iguration tlber eines der 
EXTRAM- Interface selbst laden und/oder Konf igurationen von einer 
Ubergeordneten CT uber das CT Interface anfordero. Die Funktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DE 196 54 846.2-53 sein. Die 
Konf igurat ions daten fur die PAEs werden durch die IRAM an die PAEs 
weitergeleitet oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bub systems verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung ahnlich einem Microcontrollersy-stem, des sen Busanbindung 
und/oder dessen Datentransf er und/oder dessen Programmablauf einem VPU- System 
25 entspricht . 

Es wird insbesondere Schutz fttr IPAE-RRAM-Verschaltungen beansprucht , bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonf igurierbaren Bausteins ausgestaltet sind und typischerweise 
30 beliebige Vers chal tungen und Funktionen ausftlhren kOnnen, aber jedoch 

speziell zum Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konfiguriert und verwendet werden konnen. Die 
Konf iguration erfolgt dabei bevorzugt durch die ttbergeordnete 
Konfigurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fur PAEs, die zusatzlich zu ihrem Anschluss 
an die intemen Bus syst erne des Arrays aus PAEs einen dedizierten Anschluss 
(IP-Channel) an ein Uberregionales Bus system aufweisen, das insbesondere 
Daten uber lange Strecken innerhalb des Arrays Qbertragt und/oder 

40 insbesondere direkten AnschluE an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bus system bereits 
dem peripheren Protokoll entspricht oder uber entsprechende Protokollwandler 
zur Dmsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Industriestandard entsprechen, z. B. PCI , RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS, DDR- RAM etc. urn somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerate zu ermdglichen. Qegebenenfalls 
konnen auch in zwischengeschalteten lOAGs (vgl. DE 196 54 595.1-53 ) 
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Protokollkonvertierungen derart durchgeftihrt werden, so dass ein internes 
vereinfachtes und ggf . proprietares Busprotokoll auf ein oder mehrere 
komplexere exbeme Standardprotokolle tlbersetzt werden. 
Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokoll en 
verdeutlicht wird. 

Ebenfalls ist erfindungsgemafi besonders relevant, dass PAEs auch mehrere 
Anschluss e an dedizierte Bussysteme aufweisen kdnnen. 

10 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs AnschlUsse an ein dediziertes Bus system aufweist, 
oder unterschiedliche PAEs rait einer unter schiedlichen Anzahl von Anschluss en 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detail lierte Beschreibung einer Aus f Uhrungsvar i ante 
der erf indungsgemafien Kopplung von IPAE und RRAM ausgefubrt: 

Es wird erfindungsgem&S bei einem in Funktion und/ oder Verne tzung 

20 insbesondere zur Lauf zeit ohne Storung nicht zu rekonf igurierender Elemente 
rekonf igurierbaren Zellelementef eld zur Datenverarbeitung mit Funktionszellen 
zur Ausfuhrung algebraischer und/oder logischer, konfigurier barer Funktionen 
und Speicherzellen, urn Informationen zu empfangen, abzuspeichern und/ oder 
auszugeben vorgeschlagen, da£ eine Steuerverbindung (CUD) von den 

.25 Funktionszellen zu den Speicherzellen gefOhrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und/ oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Funktionszelle, typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die n&chste ubertragene Information als 
Adresse oder als Daten behandelt werden soli und ob ein Lese- und/ oder 

30 Schreibzugriff erforderlich ist. Diese DatenUbertragung aus der 

Speicherzelle, bei der es sich etwa urn eine RAM-PAE handeln kann, auf die 
ALU-PAE erlauben dann, dafi neue, von der ALU abzuarbei tende Befehle in diese 
geladen werden kfinnen. Es ist auf diese Weise moglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funktionszellenkontrollierten 

35 Steuerverbindung zwischen Punktionszelle und Speicherzelle bereits mit nur 
zwei Elementen, die ttber geeignete Busse verbunden sind, eine 
Seguenzerstruktur in einem Zellelementef eld auf zubauen, ohne daS ansonsten 
weitere Mafinahmen und/oder bauliche Veranderungen erforderlich sind. In der 
Speicherzelle konnen Daten, Adressen, Programmschritte usw. in per se aus 

40 herkftmmlichen Pro zees or en bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstrukturen als auch vektoriellen und/oder pa- rallelisierbaren 
Strukturen besonders gut anpafibar ist. 

45 

Es ist einsichtig, dafi durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementef eld, namlich der Punktionszelle und der 

7 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonf igurierbaren Zellelementef eld aufgebaut werden kann. 
Dies ist ins of em vorteilhaft, als of t ma Is bei der Datenverarbeitung, etwa in 
einem nrultitaskingf ahigen Be triebs system, eine Reihe unterschiedlicher und 
5 voneinander per se verschiedener Aufgaben abgearbeitet werden mufi. Es konnen 
dann eine Vielzahl derar tiger Aufgaben in einem einzigen Zellelementef eld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile fur 
Echtzeitanwendungen sind of fensichtlich. Weiter ist es auch mdglich, die 
einzelnen Sequen zer a trukturen , die in einem Zell- elementefeld unter 
10 Vorsehung der erf indungsgemaSen Steuerverbindung aufgebaut werden, mit 

unterschiedlichen Taktraten zu betreiben, etwa urn den Stromverbrauch dadurch 
zu senken, da£ Aufgaben mit geringerer Prloritat langsamer abgearbeitet 
werden. Es ist Oberdies moglich, bei der Ausfuhrung per se weitgehend 
paralleler Algorithmen sequenzerartige Programmteile in dem Feld parallel 
oder vektoriell abzuarbelten und umgekehrt. 

Das Zellelementefeld mit den in Funktion und /oder Vernetzung konfigurierbaren 
Zellen kann einsichtigerwelse einen Prozessor, einen Coprozessor und/ oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder Kombinationen 
derselben . 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Elemente darstellen, die aber mit einer 
f eingranularen Statema chine versehen sein kdnnen. In einem besonders 
bevorzugten Ausfuhrungsbeispiel handelt es sich'bei den ALUs urn sogenannte 
erweiterte ALUs (EALU) , wie diese in den fruheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann insbesondere 
die Steuerleitungskontrolle, Bef ehlsdekodiereinheit etc. urafassen, soweit 
erf orderlich . Es soli darauf hingewiesen werden, dass grundsatzlich zumindest 
eine Teilmenge der Funktionszellen auch aus f eingranularen FPGA-El eraen t en 
aufgebaut sein kann. 

Die Speicherzellen konnen Da ten und /oder Inf ormationen fluchtig und/ oder 
nichtf lUchtig speichern. Wenn in den Speicherzellen abgelegte Inf ormationen, 
seien es Programmschritte, Adressen fur einen Zugrif f auf Daten oder 
registerartig bzw. heap-artig abgelegte Daten als flttchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonf iguration wahrend des Betriebes 
erfolgen. Alternativ ist es moglich, nichtf luchtige Speicherzellen 
vorzusehen. Die nichtf luchtigen Speicherzellen konnen etwa als EE- Prom- 
Bereich und dergleichen vorgesehen werden, in die ein rudiment&res Bios- 
Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszufuhren ist. 
Auf diese Weise kann ohne weitere Bau telle eine Inbetriebnahme einer 
Datenverarbeitungseinrichtung erfolgen. Ein nichtf lttchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und /der Raumgrunden 
beschlossen wird, dafi immer wieder dies el ben Programmteile auszufuhren sind, 
wobei dann auch unter solchen festen Programmteilen, etwa nach Art der WAVE- 
Rekonf iguration, im Betrieb gewechselt werden kann. Die MBglichkeiten, 

8 
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derartige nichtfluchtige Speicher vorzusehen und zu verwenden, sind 
G eg ens t and anderer Schutzrechte des Anmelders . Es 1st moglich, sowohl 
f ltlchtige als auch nichtfluchtige Da ten in den Speicherzellen abzuspeichern, 
etwa urn ein Bios-Progranna fest abzulegen und die Speicherzelle dennoch fOr 
5 andere Zwecke nutzen zu kdnnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, daS sie eine hinreichende 
Vielzahl von zu verarbeitenden Da ten und/ Oder abzuarbeitenden Programmteilen 
speichera kann. Es sei dabei darauf hingewiesen, daS diese Programmteile 

10 sowohl als Programmschritte ausgebildet sein kSnnen, die jeweils vorgeben, 
was eine ein z eine, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuemde Funktionszelle, iia nachsten Schritt zu tun hat, 
als auch ganze Konfigurationen ftir Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne wei teres moglich, daS die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, auf Grund des sen eine Rekonf iguration 
von Zellelementefeldbereichen erfolgt. Damit arbeitet die diese Konf iguration 
auslosende Funktionszelle dann zugleich als Ladelogik (CT) . Es sei darauf 
hingewiesen, daS die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Feldern wiederum moglich, andere Zellen im Verlauf der 

Programmarbeitung zu konf igurieren bzw. rekonf igurieren. Damit ergibt sich 
ein iteratives Konf igurieren von Zellelementebereichen und ein Bins chacht ein 
von Programmen mit Sequenzer- und Parallel -Strukturen, die ahnlich ineinander 
geschachtelt sind vie eine Babuschka. Es sei darauf hingewiesen, dafi hier 

25 insbesondere durch Ein-Ausgabezellen ein Zugriff auf weitere 

Zelleleznentef elder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistung massiv erhohen kann. Es 1st insbesondere 
moglich, bei Auftreten von Konfigurationen in einem Codeteil einer in ein 
Zellelementefeld hineinkonf igurierten Sequenzerstruktur gegebenenfalls 

30 entweder die Konf igurationsanforderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzufdhren und/oder es kiinnen derartige Anforderungen an eine 
Konf igurations -Master einheit abgegeben werden, ura sicherzustellen, dafi eine 
gleichmafiige Belegung aller Zellelementef elder erfolgt. Es ergibt sich somit 

35 quasi ein Unterprogrammaufruf durch Obergabe von erforderlichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fttr sich als 
schutzwtirdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofern sie selbst fur die Konfiguration anderer Zellelementfeldbereiche 
Zustandigkeit besitzen, mit hard- oder softwareartig i nT pleroen tier ten FILMD- 

40 Strukturen und dergleichen zur Sicherstellung einer ordnungsgema&en 

Rekonf iguration versehen sein kdnnen. Auf die Mdglichkeit, die Speicherzellen 
wahrend der Abarbei tung von Befehl en der art zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm andert, sei hingewiesen. 
In einer besonders bevorzugten Variante ist diese Art der Selbstraodif ikation 

45 (SM) abex durch eine entsprechende Steuerung tiber die Funktionszelle 
unterdruckt . 
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Es 1st mfiglich, daS die Speicherzelle abgespeicherte Information hier auf die 
Ansteuerung der sie steuernden Funktionszelle direkt oder indirekt auf einen 
zur Funktionszelle fuhrenden Bus gibt. Die indirekte Ausgabe kann 
insbesondere dann erfolgen, wenn beide Zellen benachbaxt 1 leg en und die durch 

5 Ansteuerung angeforderte Information an die ALU-PAE fiber ein Bus segment 
eintreffen muS, das nicht unmittelbar mit dem Ausgang der Speicherzelle 
verbunden werden kann. In einem solchen Fall kann die Speicherzelle Daten auf 
dieses Bus system insbesondere Uber Rtlckwarts register (Backward-Register) 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/ Oder Funktionszelle ein solches Backward-Regis ter aufweist, welches im 
Informationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
karm. Diese Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren Funktionalitaten versehen sein, obwohl dies etwa bei Anforderung von 
Daten aus der Speicherzelle ftir die weitere Ver arbei tung , entsprechend einem 

15 herkammlichen LOAD-Befehl eines typischen Mikroprozessors, zur Veranderung 
der Daten noch vor dem Hineinladen in die PAE ohne wei teres denkbar ist, um 
z. B. einen Befehl LOAD++ zu realisieren. 

Hit anderen Wort en werden inner halb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Anmelders 

20 typischen Forward (FREO) - und Backward (BREG) -Register gefuhrt. Diese besitzen 
die MSglichkeit Daten zwischen horizontal en Bussystemen vertikal zu 
ubertragen und k6nnen men r ere Busse multiplexen oder demul tipl exen . Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREG (entgegen 
ihrer Namensgebung) nicht zwangslauf ig Regis terstuf en darstellen, sondem 

25 lediglich optional und ggf . konfigurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREG und/ oder BREG der jeweiligen 
Funktions zellen (PAEs) gefuhrt werden, um die Busdaten transfers entsprechend 
des aktuell ausgefuhrten Befehls zu steuem. 



30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Informationen von der 
sle steuernden Funktionszelle zu empfangen, wobei auch weiter ein 
Informationseinspeichern Uber eine Ein-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuernde Zelle moglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 sollen, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE) von der 
Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenf alls auch direkt an die 
Funktionszelle (PAE) zu Obertragende Information zu lesen ist, an die I/O-PAE 
von der ALU-PAE tlbermittelt werden. Es sei in dies em Zusammenhang darauf 

40 hingewiesen, daS diese Adresse Ober eine Adre&ubersetzungstabelle 

(Adress translation table) , einen Adresstranslationbuf fer oder eine MMU-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 



45 Die Funktionszellen-Speicherzellenkombination ist demnach in einer 

bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine ex t erne Einheit, eine andere Funktionszelle, Funktions zellen- 

10 



WO 03/036507 



PCT/EP02/10572 



Speicherzellen-Kam-bination und/oder Speicherzellen Information gesandt 
und/oder von dieser erapfangen werden kann. 

Die Ein-Ausgabe-Binheit wird dabei bevorzugt gleichfalls zum Empfang von 
5 Steuerbefehlen aus der Funktionszelle ausgebildet. 

Die Fuiiktionszellen-Speicherzellenkorabination weist bevorzugt 
DatentransfermBglichkeiten an die ttbrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf, insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif f smoglichkeiten ttber die 
Bussysteme auf die entsprechenden Zellen zur Verfugung gestellt. Der Zugrif f 
erfolgt bevorzugt ttber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speicherzellenkombination, durch die Obertragung der "Port"- 
Steuerkommandos . 

15 

In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachfolgenden 
Steuerkororoandos zu Obertragen: 

20 

OPCODE FETCH, 

INTERNE /EXTERNE DATENZUGRI FFE , 

POSITIONIERUNG VON INTERNEN/ EXTERNEN ADRES SPOINTERK , 
POSITIONIERUNG VON INTERNEN/ EXTERNEN PROGRAMMPO INTERN, 
25 PROGRAMMPO INTER INCREMENT, 

POSITIONIERUNG VON INTERNEN/ EXTERNEN ST ACKPO INTERN , 
STACKZUGRI FFE (PUSH, POP) 



30 



35 



45 



Beispielsweise kann diese Funktionalitat durch folgende CMD Steuerkommandos 
implementiert werden: 



loacLconst: 
write.Jtap: 

readLRap: 

reacLReg : 

write_Reg: 



40 wr itefcdecr__Rsp : 



read&incr.^Rsp : 



set^Rpp: 
set&push^Rpp : 



Lade eine Rons tan te in ein Register 
Setze Adress Pointer fur Speicher zugrif fe 
(z. B. Heap) 

Lese Adress Pointer fur Speicher zugriff e 
(z. B. Heap) 

Lese ein Register aus dem Speicher (wenn Register in der 
RAM-PAE implementiert sind) 

Schreibe Daten in ein Register im Speicher (wenn Register 
in der RAM-PAE implementiert sind) 

Schreibe ein Datenwort auf den Stack und dekrementiert 
den Stackpointer 

Lese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 

Setze Prograinmpointer 

Schreibe Programmpo inter auf Stack und setze 
Prograinmpointer neu 
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Die S teuerkommandos dienen der Steuerung der angeschlossenen Speicherzellen 
und Punk ti one 2 ell en (PAEs). Weiterhin steuem die S teuerkommandos den 
Da ten transfer auf den Bussysteraen, beispielsweise durch Ansteuerung von 
Multiplexern, Switches, Transmission Gates, o. a. in den Forward- und 
5 Backward-Regis tern (FREG/BRBG) . Weitere Befehle sind z. B. : 

reacLPort: Lese Daten von einem Port (beispielsweise implementiert 

durch ein PRBG) zum Array 
write_Port: Schreibe Daten auf ein en Port (beispielsweise 

implement i ert durch ein BREG) zura Array 

10 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den Empfangern erfolgen. Die jeweils 
erforderlichen Steuer- und Dekodiermittel konnen problemfrei und 
kostengunstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
15 Signalen eine praktisch vollstandige Sequenzerf ahigkeit der Anordnung. DaS 
auf diese Weise eine AllgemeinzwecJcprozessordatenverarbeitungseinheit 
erhalten wird, sei erwShnt. 

Die Anordnung wird typisch so gewahlt sein, dafi die Funktionszelle als 
20 alleiniger Master auf die S teuerverbindung und/oder ein als Steuerverbindung 
dienendes Bus segment bzw. Bussystem zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt, wie sie in 
herkSmml ichen Prozessoren vorgesehen ist. 

25 Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 

benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, dafi die Zellen unmittelbar nebene inander angeordnet sind. Altemativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt dafttr, dafi keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der angef order ten Information in der Funktionszelle auf tret en, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
„direkt* verstanden. MUssen Latenzzeiten berucksichtigt werden, so kann auch 
ein Pipelining in den Seguenzerstxukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen. Es sei darauf 

hingewiesen, dafi es ohne wei teres mOglich ist, entsprechend hochf requent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
konnen , Auch in einem solchen Fall, etwa wenn per se bekannte 

40 Architekturelemente fur die Funktionszellen verwendet werden, wird 

gleichzeitig eine Rekonf igurierbarkeit des Funktionszellen el ementes und der 
zugehdrigen Vemetzungen vorzusehen sein. in einer besonders bevorzugten 
Variante sind die Funktionszellen, die Informatlonsbereitstel lungs zellen wie 
Speicherzellen, I/O- Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelmafiige Struktur vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer erst en Reihe 
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Information, das heifit Operanden, Konf igurationen. Triggers ignale usw. 
zugeftihrt, wahrend in einer darunterliegende Reihe Da ten, Triggersignale und 
andere In f orma t i onen abgegeben werden. In einem solchen Fall wird es 
bevorzugt sein, wenn die Zellen in ein und derselben Reihe liegen und es kann 
5 dann der Informations transfer aus der Inforraationsbereitstellungszelle in den 
erf order lichen Eingang der Funktionszelle fiber ein Backward-Regis ter 
erfolgen. Die MOglichkeit, die Register fur Pipelining zu benutzen, sei 
erwahnt . 

10 Es wird weiter Schutz beansprucht fur ein Verfahren zum Betrieb eines 

Zellelementefeldes, insbesondere multidimensionalen Zellelementefeldes mit 
Funk t ions zellen zur Ausfuhrung algebraischer und/oder logischer Funktionen 
und Informationsbereitstellungs zellen, insbesondere speicherzellen und/oder 
Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Inf onnationen und/oder 

15 Speichera derselben, wobei zumindest eine der Funktionszellen Steuerbef ehle 
an zumindest eine Inf ormationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbef ehle Information fur die Funktionszelle 
bereitgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgest elite Information 

20 durchzufuhren, urn so sequenzerartig Da ten zu verarbeiten. 

Es wird also in einem rekonf igurierbaren Feld durch die Ausgabe der 
Steuerbef ehle an die Speicherzelle einer Sequenzerstruktur eine 
seguenzerartige Datenverarbeitung ermOglicht. Die Be f ehle, die als 
25 Steuerbef ehle von der Funktionszelle ausgegeben werden kSnnen, ermoglichen 
dabei ein en sequenzerartigen Betrieb, wie er aus her k5mml i chen Prozessoren 
bekannt ist. Es sei darauf hingewiesen, daS es ohne we i teres moglich ist, nur 
Teile der genannten Bef ehle zu implementieren und dennoch eine vollstandig 
sequenzerartige Datenverarbeitung zu gewahrleisten. 

30 

Die vorstehende Ausftthrungsvariante wird im folgenden noch einraal und 
beispielsweise anhand der Zeichnungen beschrieben. In dieser ist gezeigt 
durch: 

35 Fig. 1 ein erfindungsgeraafies Zellelementefeld, 

Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Da t enver arbei tungs z ei ten , 
Fig, 3a eine alternative Aus ftthrungs form des Details 

40 von Fig. 2, 

Fig. 3b eine besonders bevorzugte Variante des 

Details. 

Fig, 4 Grundaufbau einer Funktions-/Speicherzelle 

(PAE) 

45 Fig. 5 eine Ausgestal tungsvariante von Fig. 3b 
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Nach Fig. l(a/b) umfaSt ein allgemein mit 0101 bezelchnetes Zellelementef eld 
zur Datenverarbei tung 0101 Funktionszellen 0102 zur Ausftlhrung von 
arithmetischen und/oder logischen Funktionen sowie Speicherzellen 0103, um 
Informationen zu empfangen, abzuspeichern und/oder auszugeben; wobei eine 
5 Steuerverblndung 0104 von Funktionszellen 0102 zu den Speicherzellen 0103 
gefUhrt 1st. 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordung der Funktionszellen und Speicherzellen 
10 dar. 

Das Zellelementef eld 0101 ist in der Vernetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zvar ohne den laufenden Betrieb nicht neu zu 
konfigurierender Zellelementeteile zu storen. Dabei konnen die Verbindungen 
konfiguriert werden, indem Bus syst erne 0105 wie erforderlich geschaltet 

15 werden. Weiter sind die Funktionszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bei den Funktionszellen handelt es sich um arithmetische 
Logikeinheiten, die um bestimrate, Rekonfiguration ermoglichende Schaltkreise 
erweitert sind, wie Statemachines, Schnittstellenbeschaltung zur 
Kommunikation mit der bevorzugt auSerhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Vbranmeldungen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

25 unmittelbar neben einer Funktionszelle 0102 liegt und hier je Reihe drei 

Speicherzellen-Funktionszellen-Paare vorliegen, in den en die Funktions- und 
Speicherzellen jeweils uber Steuerverbindungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Eingange auf, die 
mit dem Bussystem oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Weiter weisen die Zellen 0102, 
0103 Ausgange auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
ausgeben. Wie noch erlautert werden wird, ist uberdies jede Speicherzelle 
0103 mit einem Rttckwartsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kdnnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. 2) handelt es sich bei dem Zellelementef eld zur Datenverarbei tung von 

40 Fig. 1 um ein herkfimmliches Zellelementef eld, wie es bei rekonf igurierbaren 
Datenverarbei tunsanordnungen, beispielsweise einer VFU entsprechend der XPP- 
Technologie des Anmelders gebrauchlich und bekannt ist. Insbesondere kann das 
Zellelementef eld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Be schaltungen zur Wave- Rekonfiguration, zum Debugging, 

45 tfcertragen von Triggers ignal en etc. auf. 



14 



WO 03/036507 



PCT7EP02/10572 



Die Besonderheiten des Zellelementef eldes der vorliegenden Erf indxmg ergeben 
sich aus der Steuerverbindung 0104 und der zugehorigen Bescaaltung, die 
nachfolgend naTher beschrieben werden wird mit Bezug auf die Fig. 2a-c. Es sei 
dabei erwahnt, dafi, wShrend in Fig. 1 eine Steuerverbindung 0104 stets von 

5 einem weiter links liegende Funktionszellenelement zu einer we iter rechts 
liegenden Speicherzelle gefuhrt ist, und zwar nur und genau zu einer solchen 
Speicherzelle, es einleuchtenderweise mBglich ist, auch fttr die 
Steuerleitungen eine konf igurierbare Verne tzung vorzusehen, urn entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder um ggf . mehr als 

10 eine Speicherzelle ansprechen zu konnen, wenn etwa in groSem Umfange 

Speicherbedarf fur Informationen besteht, die von den Speicherzellen zu 
empf angen, abzuspeichem und/oder auszugeben ist. Aus Grunden der 
t)bersichtlichkeit wird aber in Fig. 1 und 2 lediglich auf fest vorgesebene 
einzelne Steuerverbindung en Bezug genommen, was das Vers tandni s der Brfindung 

15 wesentlich erleichtert. Die Steuerverbindung ist im ttbrigen 

erf orderlichenf alls durch herkommliche Leitungen, entsprechende Protokolle 
vorausgesetz t , substi tuierbar . 

In Fig. 2 ist die Funkt ions z ell e 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, verlauft der 

Bus 0105a, der das bereits erwahnte Backward-Register 0103a mit den Eing&ngen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 
verlauf ende Bus system ist mit 0105b bezeichnet und es sind von dem Bus system 
0105a, 0105b nur die relevanten Segmente gezeichnet. Es ist erkennbar, daS 
25 das Bus system 0105b altemativ Daten erhalt aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des RAM 0103 und dafi es Daten in den Eingang 0103al 
des Backward-Registers ftlhrt. 

Die ALU 0102 weist zugleich weitere Ein- und Ausgaiige 0102al, 0102a2 auf, die 
30 auf andere Bus segmente geschaltet sein konnen und uber welch e die ALU Daten 
wie Operanden empfangt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 bef indet sich dauerhaf t unter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindung dar, Uber 

35 welche eine Vielzahl von Bits ttbertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, dafi zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/Backward- 
Register (FRE6/BRE0) ttbertragen werden konnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Programm-Bereich. Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, Uber den bestimmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Programmbereiches jeweils lesend Oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAE Daten uber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden konnen, 
wohingegen der zeitgleich bestehenden, wenngleich nicht benutzten Verbindung 
zwischen dem Ausgang 0103c des RAM zum Bus 0105b und der Verbindung zwischen 
dem Ausgang des Backward-Registers BW zum Eingang 0102b der ALU-PAE zum 
5 Zeitpunkt von Fig. 2b keine Bedeutung zukoiniat, weshalb diese gestrichelt 
angedeutet sind. In Pig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 uber ihren Ausgang 0103c aus dem tiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information Uber das Backward-Register an den Eingang 2b der ALU-PAE 0102 
10 speist, wahrend der Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus dies em Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAM-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
tiber die Steuerleitung 0104 bzw. das Steuerleitungsbus segment 0104 empfangene 
Information decodiert wird. 

Die Aus f tinning svari ante der Erfindung wird verwendet wie folgt: 

20 

Zunachst empfangt die ALU 0102 Konf igurationsinf ormation von einer z antral en 
Ladelogik, wie im Stand der Technik bereits bekannt. Die 

Informationsubertragung kann in per ee bekannter Weise unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die M6glichkeit, bei der 
Ladelogik einen FILMO-Speicher usw. vorzusehen, urn eine ordnungsgema&e 
Konfiguration der Anordnung zu ermSglichen, wird hingewiesen. 

Mit den Daten fur die Konfiguration der ALU 0102 wird zugleich eine Reihe von 
Daten aus der Ladelogik fiber tragen, die ein sequenzerartig abzuarbeitendes 
Programm darstellt. Dieses Programm kann entweder bereits das zur Berechnung 
bzw. Ausftthrung der Applikation auszuftihrende Programm sein, Oder einen 0y 
Urlader (Boot) darstellen, der erst das auszuftihrende Applikationsprogramm 
von einer extemen Einheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann en tf alien, wenn ein Teil des der ALU zugeordneten Speichers 
nichtfluchtig (z. B. ROM, EPROM, EEFROM, Flash-ROM) ausgestaltet ist und ein 
Urlader Oder das Applikationsprogramm dort fest gespei chert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unabander 1 ich gestaltet werden kann, da eine feste Implementierung dann 
zu einer erheblichen Kostenreduktion fuhren kann. Die ALU gibt deshalb 
wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empfangene Daten Ober den Ausgang 0102c uber den Bus 0105bl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 
FAB 0103. Von der Einheit 0103d werden entsprechend des Steuerbefehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis samtliche, von der Ladelogik bei der 
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Konf iguration empf angenen Programmteile in der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konf iguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von ihr sequenzerartig abzuarbeitenden Progr annus chritte anfordem und Uber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihr em Eingang empf angen . Wahrend der Programmabarbeitung 
konnen dabei Situationen auf tret en, bei denen Sprunge innerhalb des 
Programmspeicherbereiches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE ge laden werden, Daten im Stack abgelegt werden rndssen usw. Die 

10 diesbeztigliche Kommunikation zwischen ALU-PAE und RAM-PAE erfolgt Uber die 
Steuerleitung 0104, so dafi die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durcnfuhren kann. Oberdies kdnnen auch, wie bei einem herk&nmlichen 
Mikroprozessor, Daten aus einem Stack oder einem anderen RAM-Speicherbereich 
empf angen werden und es kOnnen Oberdies Daten von aufierhalb als Operanden in 

15 der ALU-PAE empf angen werden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Befehlsdekodierung vorgenontraen . Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon fur die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird uber die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so dag die RAM-Zelle stets genau die Art des Speicherzugrif f es befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, daS 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Sequenzerstruktur vorhandenen Element en vorgegeben ist, ob auf den 
Bussen Adressen fur zu holende und /oder zu schreibende Daten oder Codes 
liegen Oder ob und gegebenenfalls wohin Daten zu schreiben sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder verandert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Variant en. 

35 Nach Fig, 3a ist zur Verbindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondern es sind auch ein 
Vorwarts-Register an der RAM-PAE und Vorwarts- und Ruckwarts -Register an der 
ALU-PAE vorhanden. Diese konnen, wie durch die Mehrfach-Pfeile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen Hosts, extemen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Sequenzerstruktur en, PAEs, RAM-PAEs etc. Daten zu empf angen und an diese zu 
senden. Wenn ein entsprechender Anf orderungsbef ehl fur neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es moglich, Progr ammbl ttcke in der Sequenzerstruktur 

45 abzuarbeiten, die weit grSSer sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei komplexen Datenverarbeitungsaufgaben, 
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SprOngen ttber weite Bereiche, insbesondere in Unterprogramme usw. von 
massivem Vorteil . 

Eine noch welter bevorzugte Variante 1st in Fig. 3b gezeigt. Hier 
5 konnminiziert die ALU-PAE nicht nur mit einer RAM-PAE, sondern zugleich mit 
einer Input/Output-PAB, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung fttr die Kannnunikation mit extemen Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VFUs , fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU-PAE die Einheit, die als Master fur 
10 die als ,CMD* bezeichnete Steuerverbindung arbeitet und wiederum werden die 
Busse in Multiplex -Weise verwendet. Auch bier kann eine Obertragung von Daten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Regis ter erf olgen. 

15 Die in Fig. 3b gezeigte Anordnung ermoglicht es, exteme Zugriffe auf nicht 
in der Speicherzelle RAM-PAE abspei cherbare Inf ormationen besonders leicht zu 
gestalten und ermoglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkommliche CPO-Technologien und der en Betriebsverfahren in noch 
starkerem MaSe insoweit, als nun in der Eingabe-Ausgabezelle 

20 Adressttbersetzungsmittel, Speicherverwaltungseinheiten ( MMU- Funk t i onen ) und 
dergleichen implementiert sein konnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, daS mehrere Sequenz er s truktur en gleichzeitig in 
25 ein und dasselbe Feld hineinkonf iguriert werden kSnnen, dafi Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise fttr Sequenzerstruktur en 
und/oder eine fttr die XPP-Technologie herkommliche Weise konf iguriert werden 
konnen und dafi es ohne wei teres moglich ist, dafi eine ALU an eine andere ALU 
Daten ausgibt, die diese in einer Sequenzer-Weise konf igurieren und/oder zum 
30 Teil eines Zellelmentefeldes machen, mit dem eine bestimmte Konf igurat ion 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer oder mehreren ALUs und/oder 
ein em Speicher und/oder FPGA-Elementen erhalt Daten von dem Bussystem 0105a 
und ttbertragt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREO, 0403) angeordnet und ttbertragen Daten von 0105a nach 0105b (FREG) bzw. 
40 von 0105b nach 0105a (BREO) .BREO und FREG konnen eberifalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen en thai ten. Bevorzugt 
sind diese jedoch in ihrem Funktionsumfang gegenuber dem Kern (0401) 
eingeschrankt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 Obertragung von Daten (DATA) und ein Bussystem zur Obertragung von Trigger, 
also Status signal en (TRIGGER) unterteilt. 
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Die Konfiguration der PAE erfolgt durch eine ttbergeordnete 
Konfigurationseinheit (z. B. eine CT) , die tlber einen Konfigurationsbus 
(0404) Konfigurationsworte an die PAB tlbertragt. Diese werden in 
Konfigurationsregistern gespeichert (0405). Optional kann ein 
5 Konfigurationsstack (0406) nach PACT17 und wie nachfolgend beschrieben 

zwischen den Konfigurationsbus (0404) und die Konf igurationsregister (0405) 
zwischengeschaltet sein. 

Der Konfigurationsstack kann Daten und/oder bevorzugt Trigger von den 
Bussystemen 0105 (a/b) empfangen und an diese senden. 

10 

Die PAE kann optional einen Anschlufi an ein dediziertes Bus system (10- 
Channel, 0407) aufweisen. Zur Steuerung des Bussystems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet. Ober den IO-Channel 
kan die PAE direkt mit einem global en, ggf . auch extemen Speicher und/oder 
15 Peripherie und/oder anderen PAEs Daten ttbertragen. 

In einer bevorzugt en Ausgestaltung besteht die Moglichkeit Konstanten fur die 
Datenverarbeitung Ober 0404 zu setzen. In einer welter en Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregietern 
20 auslesen . 

Figur 4 kann auch eine entsprechende RAM- PAE darstellen. Ober 0404 kann dann 
von einer CT die Vemetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfa&t beispielswiese folgende Funktion en oder Kombinationen 
25 daraus: 

1. Random Access 

2. FIFO 

3. Stack 
30 4. Cache 

5. Page Memory fur MMOs 

Desweiteren kann in einer bevorzugten Ausftthrung der Speicher mit Daten von 
der CT vorgeladen werden (2. B. Konstanten, 
35 Lookup-Tabellen, etc.). Ebenfalls kann die CT in einer erweiterten Ausfuhrung 
Daten (z. B. zum Debuggen oder fur Taskwechsel) aus dem Speicher uber 0404 
zurttcklesen. 

In einer bevorzugten Ausfuhrung kann eine RAM- PAE mehrere Anschldsse an das 
Bus system 0105 aufwei sen (dual -port oder multi-port) , wodurch mehrere 
40 Da ten transfers gleichzeitig durchgefUhrt werden kflnnen. 

In. einer weiteren Ausfuhrung kann die RAM- PAE einen dedizierten Anschlufi an 
einen extemen Bus aufwei sen. 

RAM- PAEs kOnnen der art zusammengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grOfierer Speicher entsteht. 

45 
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Figur 5 zeigt eine Ausgestaltungsvariante des Sequenzers nach Pigur 3b. Die 
ALU-PAE weist einen minimal en Regis tersatz Ra, Rb, Rx auf, der in dies em 
Beispiel lediglich zur Pufferung der Operanden und Krgebnisse dient. Der 
eigentliche Registersatz liegt in der RAM-PAE (R0..Rn). Ebenfalls innerhalb 
5 der RAM-PAE liegen die Register 
Rpp: Frogramm Pointer 

Rap: Adress Pointer fur Datenzugrif f e (z.B. Heap) 

Rsp: Stack Pointer fur Stackzugrif fe 

Rfp: Frame Pointer zur Sicherung des Stack Pointers 

10 bei Unterprogrammaufrufen 

Der CMD-Bus wird von der ALU-PAE gesteuert und ttbertragt die 
Ablauf information des Sequenzers an samtliche beteiligten PAEs, sowie FREG 
und BREG zur Steuerung der Datenttbertragung auf den Bussystemen (0105a, 
15 0105b) . 

Die RAM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten IO- 
Cannel (0501) auf, Ober welchen sie ggf . auch selbststandig (z. B. Ober DMA- 
Kontroller) Da ten von Oder zu peripheren Einheiten (z.B. IO, Speicher) 
tibertragen kann. Es soil nochmals darauf hingewiesen werden, dass auch die 
20 ALU- PAEs einen solchen dedizierten AnschluS aufweisen konnen oder in einer 
welter en Ausgestaltungsvariante die ALU-PAE anstatt der RAM-PAE einen 
derartigen AnschluS besitzen konnte . 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und/ oder Speicher zel lea) 

25 implementiert. Ober Eingabe- Ports (0502) konnen Da ten von dem PA gelesen 
werden und ttber Ausgabe-Ports (0503) konnen die Da ten ausgetauscht werden. 
Die Port werden bei spiel sweise uber die CMD-Steuerkoinmandos readjport und 
write_port angesteuert und schalten die Bus systems entsprechend . Mit den 
Steuerkommandos wird ein Selektor tibertragen , der anzeigt welcher Port durch 

30 das Steuerkommando angesprochen ist. 

Die vorliegend of fenbarte Lage der Register innerhalb der RAM-PAE ist 
ungewOhnlich, bietet aber zwei erhebliche Vorteile: 

a) Speicherzellen konnen fur die Register verwendet werden. 

b) Die Pointer liegen direkt In der RAM-PAE, wodurch Datenzugrif fe auf den 
35 Speicher besonders schnell werden, Desweiteren ist fur samtliche Speicher- 

Zugriffe nur ein Bus auf dem Bus system 0105 notwendig, wobei der 
normalerweise zusatzlich erforderliche Adressbus entfallt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als voro Anmelder bevorzugt typisch implementiert . 

40 

FOr samtliche Da ten transfers ist die Lage der Register zu beach ten. Um 
lediglich moglichst einfache Befehle im Sequenzer zu implementieren, sind 
daher besondere Befehle zur Regis termanipulation vorgesehen: 
moveta Rrr: Ladt das Register Rrr (rr e {l..n, sp, pp, 
45 fp, ap>) nach Ra 

movetb Rrr: Ladt das Register Rrr nach Rb 



20 



WO 03/036507 



PCT/EP02/10572 



movefx Rrr: Schreibt das Register Rx nach Rrr 

Um den Datenf lu&character der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode iroplementiert: 

feed: tJbertr&gt Da ten von Ra/Rb nach Rx, ohne diese 

zu manipulieren. 

Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2: 
moveta Rl; movetb R2; add; movefx R2; 

Schiebe Register R4 nach Register R7: 
moveta R4; feed; movefx R7; 

©bertrage R5 auf Stack: 

moveta R5; feed; push; 
Anmerkung : push ubertragt Da ten des Registers Rx an die Speicherstelle auf 
die Rsp zeigt und dekrementiert (bzw. inkermentiert) Rsp. 

Setze Adresspo inter Rap mit der indirekten Adresse R4 addiert zu R7: 
moveta R4; movetb R7; add; movefx Ra; 

Lade Da ten aus Speicherstelle Rap nach Rl: 

load; feed; movefx Rl; 
Anmerkung: load ubertragt Daten von der Speicherstelle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fur n = 7) . Register werden 
beispielsweise angesprochen, indem beim Auftreten des entsprechenden CMD 
Steuerkommandos- (z. B. read_reg, write_reg) die Regis temummer mi tuber tragen 
wird, diese als Adresse an den Speicher Ober tragen wird und die hBherwertigen 
Adressbits mit 0 gefllllt werden. 

Die Startadresse fur den Code ware dann beispielsweise 0x8 (also 0x(n+l)), 
worauf dann der Programrapointer Rpp nach ein em Reset zeigen wUrde. 
Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondem in 
gesondert implementierten Registem untergebr acht , um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermSglichen. 

In Pigur 5b ist eine Architekturvariante mit Regis tersatz innerhalb der ALU- 
PAB dargestellt. Die umstandlichen Registertransferoperationen entf alien 
damit, wodurch diese Variante auch erheblich schneller in der 
Datenverarbeitung ist. Aller dings ist sind die Hardwarekosten hflher, da der 
Regis tersatz zusatzlich implement iert werden muss und fur samtliche 
Speicher zugriffe die Adressen von der ALU-PAE an die RAM-PAS ubertragen 
werden mussen. 
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RAMoverPAE 

Die nachfolgend beschriebene besondere Ausgestaltung einer ALU-PAE (im 
Folgenden mit ROP-PAE bezel chnet) eigne t sich besonders fur VPUs, deren 
Application irregulare seguentielle Codes aufweisen, die auf kleine 
5 Datenmengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAB Speicher integriert 
{Integrated RAM = I RAM) , auf den die ALU direkten Schreib/Lese-Zugrif f 
besitzt. Die ALU ist entsprechend urn eine Adressverwaltungsschaltuag 
10 erweitert. Insbesondere kOnnen daher PAEs nach dem vorstehend bes chr i ebenen 
Aufbau (I PAEs) verwendet werden, wobei der separate REAM ggf . entfallt und 
durch den integrierten I RAM ersetzt ist Oder der RRAM zusatzlich zum intern en 
I RAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten Aiisfuhrung ist ein Sequenzer bzw. 

Microcontroller mit ein em bevorzugt limi tier ten aber bevorzugt vollstandigen 
Befehlssatz {vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes erraoglicht. In einer weiteren 
Aus ftttirungsvari ante kann der Sequenzer in seiner Funk t ion und seinem 

20 Abl auf verbal ten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

nach dem stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Sequenzer /Microcontroller kann auf Zustande (z.B. 
Statussignale, Ereignisse) in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind (z.B. Ober ein 

25 Bussyetem) reagieren. 

Der Sequenzer /Micro controller liest seine Programmbef ehle aus dem IRAM. 
Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den ublichen PAEs, 
ebenso die Generierung, der Empfang und die Weiterleitung von Status signal en 
(Trigger nach PACT08) . Mehrere Busanbindungen fur Daten- und Triggereingange 

30 und fur Daten- und Triggerausgange k6nnen vorgesehen sein. 

Die ROP-PAE kann Operanden vom Bus lesen ggf. mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

In die ROP-PAE ist in einer bevorzugten Ausgestaltung ein Regis tersatz 
integriert. Der Regis tersatz kann in einer besonderen Ausgestaltung ahnlich 

35 des Registersatzes von Transputern als Stack organisiert. Dadurch kann der 
Regis tersatz besonders Id ein und hardware technisch eff izient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) • Weiterhin 1st aus 
der Transputertechnologie bekannt , dass Compiler eff izient mit einem 
derartigen hardware technisch kostengflnstigen Registersatz arbei ten konnen. 

40 Eben falls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten AusfOhrung besitzt die ROP-PAE direkten AnschluS 
(EXTBUS) an ein extemes RAM und/oder externe 10. Es konnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaltung kann der EXTBUS Ober eine, ggf. dedizierte, 
Verbindung des PAE-Bue systems an eine Interface-Baugruppe (IOAG) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei durch die Inter face-Baugruppe. 

In einer bevorzugten Ausfuhrung kann die ROP-PAE und dabei bevorzugt das I RAM 
5 direkt selbstandig Adressen fur das externe RAM und/oder die externe 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und externe oder 
interne Da ten transfers selbstandig steuem. Diese Funktion kann durch 
eigenstandige im RRAM implementierte Adressgeneratoren realisiert warden. 
Beispielsweise eignen sich DMA-Kontroller besonders fur diese Aufgabe, indem 
10 sie blockweise Daten zwischen den Speichern kopieren. Der Adressraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
Xn einer hardwaremaSig aufwendigeren Losung kann die Funktion durch eine 
implementierte MemoryManageinen tDni t (MMU) realisiert sein. Die Funktion sweise 
15 ist durch den Stand der Technik definiert und bekannt. Zusammengefafit 
arbeitet eine MMU wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 

auf geteilt . Jede Page en thai t Daten eines. virtuellen Speicherraumes innerhalb 

eines extemen Speichers. Beispielsweise konnen die hexadezimalen RRAM- 

20 Adressen 0x0 aOO . .OxOaf f Daten des extemen Speichers an den Adressen 

0xbdl3200. .0xbdl32££ en thai ten. Zur Verwaltung der Adressumsetzung wird eine 
Adressubersetzungseinheit verwendet, die gewohnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMU ist es insbesondere einen grofien 
Speicherraum auf einen sehr viel Kleiner en (in dies era Fall der RRAM) zu 

25 ubersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem grofcen 
Speicherraum in den Kl einen kopiert werden. Sobald eine Seite nicht mehr 
benotigt wird kann diese gel6scht und/oder uberschrieben werden. Wenn die 
Daten auf der Seite verandert wurden, wird die Seite bevorzugt vor dem 
Ijoschen/Oberschreiben in den grofien Speicherraum zuruckgeschrieben . 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein hoherwer tiger Teil der 
physikalischen Adresse (also die Adresse der Seite) in dem Lookup- Speicher 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesera Fall muss die Seite erst* von dem 
grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemaS dem vorstehenden Ablauf 
Uberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
40 durch den Sequenzer erfolgen, indem von der MMU ein DMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden Sei tenadressen im RRAM und 
extemen RAM, sowie die Seitengrofie durch die MMD zur Verfugung gestellt (z. 
B. in Register eingetragen) . 

45 Die ROP-PAE besitzt einen AnschluS an eine Konfigurationseinheit die die ROP- 
PAE entsprechend des ublichen Verf ahrens konfiguriert und rekonf iguriert. In 
einer bevorzugten Ausfuhrung kann die CT auf den I RAM lesend und/oder 
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schreibend zugreifen, um Daten und/oder Code fur den Sequenzer im I RAM zu 
verwalten. 

In elner besonders bevorzugten Ausgestaltung kann die ROP-PAE selbstandig 
5 Code fttr den Sequenzer tiber das PA Bus system und/oder den EXTBUS aus dem 
extemen RAM laden. 

In einer bevorzugten Ausfuhrung ist der I RAM in roehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kdnnen 
10 beispielsweise fttr einige der folgenden Funktionen aufgeteilt sein: 

Sequenzer speicher, Stack (z.B. ftir Registersatz) , Datenspeicher, Heap, 10- 
Puffer, Puffer zu ex tern em RAM bzw. Cache, Lookuptabellen, Konfigurationen 
ftir PAEs und/oder Busse, der Registersatz der ROP-PAB. 

Je nach Punk t ion konnen dazu f olgende Ansteuermechanismen vorgesehen sein: 
15 Sequenzer- /Code- Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speicherstelle des Stack (Rsp), 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z.B. Intel Pentium) bekannt ist. 
20 Konfigurationen ftir PAEs und/oder Busse: Hi err auf kann ein Zeiger innerhalb 
der CT und/oder - implementierungsabhangig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE mit bevorzugt 

25 hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Compiler oder Programmierer aufgebaut. Die 
Adressierung dieser Bereich erfolgt durch das auszuftihrende Programm und/oder 
Be triebs systems und wird innerhalb der Programmes und/oder Betriebssystems, 

30 ggf . unter Zuhilf enahme der Regis tersatzes und der ALU des Sequenzers, 
berechnet . 

In einer roiJg lichen Variante ist der IRAM komplett oder teilveise, wie bei den 
IPAEs beschrieben, durch RAM- PAEs. au&erhalb der ROP-PAE realisiert. Ftir ggf. 
unterschiedliche Segmente konnen unterschiedliche RAM- PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung konnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMU besitzen und 
somit selbstandig Daten in oder aus den ihrera Speicher von oder nach anderen 
Speichern oder Peripheriegeraten kopieren. Insbesondere konnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538-0 aufweiaen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei ftir jedes Segment einzeln die 
Funktion konf igurierbar und/oder durch den Sequenzer programmi erbar ist. 

In einer Ausfuhrung kann der IRAM als Multi-Port Speicher ausgeftihrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugrif f durch 
mehrere Speicherzugrif f seinheiten auf den Speicherinhalt ermttglichen. 
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Speicherzugrif f seinheiten kSnnen beispielsweise externe und/oder interne 
Peripherie, Prozessoren, andere PAEs sein. 

In einer besonderen Ausfuhrung kann die ROP-PAE als lokale und ggf . auch 
5 global e Konf igurations einhei t ahnlich einer CT fUr ROP-PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit. Wird die ROP-PAE als globale 
Konf igurations einhei t verwendet, oder hat sie sehr viele lokale PAEs zu 

10 konfigurieren, wird bevorzugt das Verfahren nach der DE 196 54 593.5-53 

verwendet, das eine FILMD-Funktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Sequencer /Microcontroller Konf igurationen im IRAM und konf iguriert 
diese an PAEs und/ oder sich selbst und/ oder bestimmt den Ablauf des 

15 Sequenzers/Microcontrollers . Bevorzugt findet hierbei eine Synchronisation 
mit einer Obergeordneten Konf igurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konf igurationen Uber eines der 
EXTRAM- Interfaces selbst laden und/oder Konf igurationen von einer 

20 Obergeordneten Konf igurationseinheit Uber das CT Interface anfordern. Die 
Funktionsweise kann ahnlich der Rekonf igurationseinheit in der DE 196 54 
846.2-53 sein. 

ZusammengefaSt 1st der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
25 Microcontrollersystemes, des sen Busanbindung und/oder dessen Datentransfers 
und/oder dessen Progrananablauf einem VPU-System entspricht. Mit anderen 
Worten handelt es sich um eine Multiprozessoranordnung, der en Bus system auf 
dem Prinzip der VPU-Archi tektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer Obergeordneten Steuer einhei t (CT) verwaltet. Die 
30 DatenUbertragung ist s e lbs t synchroni s i er end tiber die RDY/ACK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der uber das Triggerbus system reprasentiert wird 
und den Status einer Menge von Prozessoren reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden muS. Bierzu wird 
35 verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht fur ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die intern en Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (IO- Channel) an ein Oberregionales Bus system aufweisen, das 

40 insbesondere Daten uber lange Strecken inner halb des Arrays Gbertragt 

und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
Anschlufi an die Peripherie kann dabei direkt erfolgen, indent z. B. das 
Bus system bereits dem peripheren Protokoll entspricht oder uber entsprechende 
Protokollwandler zur Umsetzung des Protokolls erfolgen. Das dedizierte 

45 Bussystem kann dabei bereits einem Industriestandard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR- RAM, etc. um somit einen 
einfachen und unaufwendigen Anschluss der peripheren Gerate zu erm&glichen. 
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Gegeben en falls konnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart durchgefuhrt werden, dass ein 
internes vereinfachtes und ggf . proprie tares Busprotokoll auf ein oder 
raehrere komplexere externe Standardprotokolle ttbersetzt werden. 
5 Es soli besonders darauf hingewiesen werden, dass unter Peripherie auch 

Speicher veretanden werden, wie bei den bereits aufgezahlten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist er f indung sgemafi besonders relevant, dass PAEs auch mehrere 
Anschlusse an dedizierte Bussysteme aufweisen konnen. 
10 Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 

nur eine Teilmenge der PAEs Anschltisse an ein dediziertes Bus system aufweist, 
. oder unterschiedliche PAEs mit einer unter schied lichen Anzahl von AnschlUssen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halblei terhers tellungsver fahren und -strukturen besonders leistungsfahig 
implement! ert werden, indem der Speicher auf dem physikalischen Chip raumlich 
Uber oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. Rierfur wird Schutz beansprucht. 

20 Dazu wird uber der nach dem Stand der Technik bekannten ersten 
Halblei ter struktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine oder mehrere weitere Kbenon von 

Halbl e i t er s t ruk tur en (Transistorstrukturen) aufgebracht, die fur zusatzliche 
Funktionen genutzt werden kOnnen. Beispielsweise konnen in einer ersten Ebene 
25 . die Logik und Gatter der PAE-Funktion und in einer wei teren zusatzlichen 
Ebene die Speicher funktionen implementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halblei ter schichten durch 
eine Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Viae) aufweisen, urn Signal e zwischen den einzelnen 
30 Halblei ter schichten zu Obertragen. 

Die Verdrahtungs struktur kann je nach Anwendung unterschiedlich implementiert 
sein. Beispielsweise konnen direkt uber jeder Halblei terschicht 
Verdrahtungsebenen und/ oder eine global e Verdrahtungs ebene, die alien 
Halblei ter schichten zugeordnet ist vorgesehen sein. 

35 

Ura eine wirtschaftliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beach ten, dass der 
S tromver branch , also die Verlustlei stung, aller Halbleiterstrukturebenen 
40 zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
Oberhitzung und dem damit verbundenen Ausfall der Schaltung fuhrt. 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anf orderungen entsprochen 
werden. 

45 Beispielsweise ist fur die vorgeschlagene Arcnitektur eine Ebene von 
Logikhalbleiterstrukturen und eine weitere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die fur diese Anf orderungen geeignet 
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sind. Wahrend die irregular en und wenig redundanten Irogikhalbleitexstrukturen 
eine vergleichsweise hohe Pehlerquote mit hoher Verlust lei stung aufweisen, 
k6nnen Speicherhalblei ter strukturen vergleichsweise redundant mit niederer 
Pehlerquote und durch geeignete Speicherverfahren (z. B. DRAM) auch mit 
5 geringer Verlustleistung implementiert we r den . Es wird explizit darauf 

hingewiesen, da£ es meglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherplatze und/oder alle Logikhalbleiter strukturen voll funktional sind; 
es ist lediglich erforderlich, Mindestanf orderungen sicherzustellen und/oder 
eine ordnungsgema^e Verwaltung. Redundanz en sind bevorzugt fttr beide 
10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach ttbereinander liegenden Halbleister strukturen 
kann nach unterschiedlichen Verfahren erfolgen. Neben dem bereits 
beschriebenen Verfahren des Aufbringens einer weiteren Halbleiterebene uber 

15 einer Isolierschicht, was z. B. durch Aufdampf en und/oder Aufkristallisieren 
erfolgen kann, sind auch thermische Oder mechanische Verbindungen mOglich, 
indem z. B. die auf zubringende Siliziumstruktur aufgeldtet- oder aufgeklebt 
wird. Zum AuflSten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiterchips mit Gehausen bekannt sind. 

20 Dabei handelt es sich beispielsweise urn Reflow-L&tung Oder Thermokompression . 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden mfiglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hi ex fur ist, dass die Siliziumstruktur en unterschiedliche 
GrSBen aufweisen, sodass die Drahte von einer Siliziumstrukturoberfiache zur 

25 nachsten gedrahtet werden kOnnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist, damit diese mittels Wirebond noch realisiert 
werden kttnnen . 

Zur Optimierung der Ausbeute kann insbesondere das Redundanz verfahren nach DE 

30 197 57 200.6-33 angewendet werden. Es soli erwahnt sein, dass das Verfahren 
nach DB 197 57 200.6-33 fttr alle PAEs vorgesehen werden kann, also z. B. fur 
ALU- PAEs genauso wie fttr RAM- PAEs. Mit anderen Worten kOnnen fttr samtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverf ahren sind implementierbar. 

35 Fttr PAEs mit hauptsachtlich f eingranularen Strukturen, also z. B. Speicher 

(RAM- PAEs) oder FPGAs ist es von Vorteil, diese f eingranularen Strukturen mit 
einer entsprechend f eingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondera die feingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 

(bzw. FPGA-Zellen) redundante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (I#eitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erfordemisse einer redundanten Struktur 
angepafit. Der Aufbau redundanter Strukturen fttr feingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Fur 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 



27 



WO 03/036507 



PCT/EP02/10572 



Die Verlustleistung la£t sich nach den Verfahren von DE 196 51 075,9-53 und 
DE 101 35 210.7-53 erheblicb minimieren, wodurch sehr hohe 
Integrationsdichten ermSglicht warden. 

5 Es soil darauf hingewiesen werden, dass die Anzahl der ubereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenzt 1st. Mit fortschrei tender 
techniBcher Entwicklung und Optimierung ist eine steigende, auch sehr groSe 
Zahl von tlbereinanderliegenden Ebenen realisierbar . 

0 Die Ebenenaufteilung raufi dabei, weder bei einer zweilagigen, noch bei einer 
mehrlagigen Struktur auf eine ALU-Speicher-auf teilung limitiert sein. Bereits 
bei zweilagigen Struktur en kann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die andere Lage komplett fur die 
Bussysteme oder die Bus syst erne und IO-Ansteuerungen (IOAGs) zu verwenden. Die 

5 Bussysteme konnen dabei uber die einfache Verdrahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
Verstarkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halbleiterstrukturen zu der en Realisierung 
benOtigen en thai ten, 

0 Desweiteren kann es sinnvoll sein, eine Ebene fur die Konf igurationsspeicher 
und/oder Konf igurationsregister und/oder CT und der en Speicher vorzusehen. 

Figur 6 zeigt eine Implement! erung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE implementiert. Der gesamte Registersatz 

5 (R0..Rn, Rpp, Rap, Rfp, Rap) ist in der ROP-PAE. untergebracht . Zugriffe auf 
die Register durch die ALU sind schnell und mit geringem Auf wand m&glich. 
Adressen und Da ten kdnnen direkt von der ALU an den Speicher tiber tragen 
werden, ohne ein Bus system aufierhalb der ROP-PAE wie z. B. 0105 zu benStigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte IO-Channel zur 

0 Datentibertragung mit der Peripherie auf t bei spiel sweise 0601, 0602). 

Datenverbindungen zu den restlichen PAEs kSnnen wie bereits bekannt durch 
FREG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibrport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
5 damit bereits eine interne RUckkopplung des ALU-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendung eines ROP-PAE extemen 
Busses (z.B. 0105) und einer Rtlckkopplung durch ein BREG, wie bereits bekannt 
erfolgen (0605). 

0 Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
DatenQbertragung (0701), bei welchen zwel Dice (0702, 0703), also zwei Chips, 
aufeinander raontiert sind. Ein Chip best eh t stark vereinf acht aus einer 
Halblei ter ebene zur Realisierung von Transistoren (z. B. Silizium, 0704), 

5 mehreren Me tall lag en zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und gegentiber 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsfahigen Isolierschicht 
0706. In die Isolierschichten sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingeftlgt. 

5 In Figur 7b sind die beiden Dices mittels einer Art Flip-Chip-Technologie 
miteinander verbunden, wobei die Obertxagung von Signal en durch sogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie gegebenen Moglichkeiten des AnschluS von Bumps (0711) auf 
der jeweils obersten Me tall lag e soil hier die besondere erfindungsgemafie 

10 Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterschicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupfer) , also Vias (0712), durch die Siliziumschicht nach 
unten gefuhrt. Die Durchfuhrung erfolgt bevorzugt durch Xtzen von 
entsprechenden Ltfchern in die Halbl ei ter ebene . Zwischen den Verbindungen und 

15 der Halbleiterschicht wird eine Isolierung eingefagt. 

Die Durchfuhrung kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zunachst Wannen 
(0731) in die Halbleiterschicht geatzt, die mit einer Isolierung gefullt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer erst en 
Halblei ter s truktur , die in dies em Fall dunner ausf alien kann, wird eine 
weitere Halblei terebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zunachst durch Atzen und /oder Schleifen moglichst eben geinacht. Das 
Aufbringen der Halbleiterschicht kann durch Aufdampfen, Auf ziahen von 
Kris tall en oder bevorzugt durch Auf kl eben oder klebeahnl ichen Verbindungen 
aufgebracht. Wesentlich, v. a. bei der Verwendung von Verkl ebungen 1st, dass 
durch die aufgebrachte Halblei ters truktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erf order lich, urn 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darun t er 1 i egenden 
Isolierschicht zu ftthren. 

Die Durchfuhrung der Kontakte erfolgt gemaS Figur 7d z. B. durch das Einatzen 
schmaler Kanale, in die ein Isoliermaterial eingebracht wird. Danach wird in 
35 einem we iter en Schritt in das Isoliermatierial ein schmaleres Via eingefagt, 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Xtzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grosser er Wannen (0731) vor, welche 
mlt Isoliermaterial gefOllt werden. In die Wannen werden dann ggf . mehrere 
40 Vias (0712) wie beschrieben eingefttgt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel. Die Halblei terebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Umrandung . Dazwischen liegen 
45 die Hetalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind grOfiere Stapel, z.B. mit 3,4, oder mehr Eben en 
m&glich. 
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Die mehrfache beschriebene Auftrennung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schal teinhei ten 
5 und der IO-Struktur von den ALUs und Speichem, die sich in diesem Bei spiel 
in derselben Ebene befinden. 1 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustlei stung an den au&eren Randern der Stapel untergebracht . Besonders 
10 hierfttr wird Schutz beansprucht, da dadurch eine besonders optimale 

Warmeabfuhr mOglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mit tier en Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mit tier en Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
15 10 sind zur optimal en Warmeabfuhr in den Randern untergebracht. 

IOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (IORAM-PAEs) mit einem dedizierten 

Anschluss an externe Einhelten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind aus DE 196 54 595.1-53 und DE 102 06 653.1 dedizierte 

Einheiten (z. B. Interface- Baugruppen (IBG) ) zum Anschluss von extemen 

Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verf ahren welsen das Problem auf, dass ein zusatzlicher Auf wand zur 

Datenkommunikation zwischen PAEs, insbesondere datenverarbei tender und/oder 
25 datenberechnender PAEs und extern en Einheiten betrieben werden muss , indem 

die Da ten explizit zwischen den PAEs und den IBGs und/oder IORAM-PAEs 

Ubertragen werden mils sen. 

Es wird nunmehr erf indungsgemafi vorgeschlagen und wie bereits vorstehend 

30 mehrfach erwahnt fur beliebige PAEs, insbesondere jedoch fur 

datenverarbei tende und/oder datenberechnende PAEs (z. B. ALU- PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspei chernde PAEs (RAM- PAEs nach DE 
100 50 442.6 ) einen Oder mehrere dedizierten Anschlusse (lO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte KommunikationsmSglichkeit der PAEs, die nachfolgend IOx-PAEs 
genannt werden, und extemen Einheiten gegeben . Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (externem Speicher und/oder IO-Einhei ten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konfigurierbaren Bussysteme der PAEs 

40 untereinander (BUS) mttssen nicht mit den IO-Daten transfers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausges tal tung des IO-Channel die 
Adressierung der Daten ftlr oder einzelne PAEs sehr viel einfacher 
durchgefOhrt werden, als dies mittels des BUS mOglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen IO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse uber den IO-Channel ubertragen wird und jede Einheit diese Adresse 
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mit ihrer eigenen vergleicht. Wenn die Adressen ubereinstimmen, 1st die 
Einheit adressiert und die Daten sind fur diese Einheit bestimmt. 
Bevorzugt kann jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit fOr die die Daten bestimrat sind, sondern auch ihre eigene Adresse 
5 Obertragen, urn eine Identification des Senders zu erroSglichen. 

Besonders ef fizient kann das Vorsehen von IO-Channels fdr nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs mit 
IO-Channel-Erweiterung innerhalb einer Anordnung von PAEs (PAE- Array, pa) 
0 vorzusehen. Dadurch wird eine verbesBerte Flachen- und Kosteneff izienz 
gegenttber der Implementierung der IO-Channel-Erweiterung in alle PAEs 
erreicht . 

PAEs, die besonders hone Komraunikationsanf orderungen aufweisen, k6nnen 
5 applikationsabhangig auch an mehrere IO-Channel angeschlossen sein. 

Die dedizieren IO-Channels kOnnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein r z. B. insbesondere nach DE 197 04 742.4 oder als paralleles 
Standardbussys tern wie Rapid- 10, PCI, AMBA oder serielles Standardbus system 
0 wie USB, Firewire, Ethernet. 

Besonders leistungsfahig kann die Implementierung von IO-Channels in PAEs 
dann sein, wenn diese nicht direkt an die extern en Einheiten gefflhrt sind, 
sondern zunachst an eine IO-Verwaltungseinheit (IOAO) , die ahnlich dem 

5 Protokollkonverter nach DE 102 06 653.1 oder der IOAG nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einf aches internes 
Busprotokoll zur Steuerung der IO-Channels verwendet werden kann. Ebenso wird 
nur eine geringe ■Intelligenz" in jeder einen IO-Channel aufweisenden PAE 
benfltigt, wodurch die PAEs jeweils flachenma&Lg klein und unaufwendig zu 

0 pr ogr ammi eren sind. 

Die eigentliche Verwaltung und Ansteuerung der externen Einheiten wird in den 
IOAGs durchgeftihrt, die durchaus grCfier und aufwendiger ausgestaltet sein 
k6nnen. 

5 Die IOAGs kfinnen zur Erf 111 lung ihrer Aufgabe selbst eigene Sequenzer und/ oder 
Mikrokontroller und ggf. auch eigenen Speicher aufweisen. Insbesondere kann 
die IOAO auch Speichermanageroenteinheiten und Adressubersetzungseinheiten 
aufweisen. Je nach Applikation kttnnen Interruptkontroller wie z. B. nach dem 
Stand der Technik bekannte (18259) in der IOAO implement! ert sein, die 

W Interrupts ggf. auf Triggersignale nach DE 197 04 728.9 ftbersetzen. 



SIMD PAEs 

Bei der Verwendung von rekonf igurierbaren Technologien zur Verarbeitung von 
Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 
mdglichst hohe Rechenleistung zu erhalten, komplexe ALUs erforderlich, wobei 
der Auf wand fur die Rekonf iguration minimal sein sollte; (2) es soil ten die 
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ALUs maglichst einfach und feingranular sein, um eine effiziente 
Datenverarbeitung auf Bitebene zu ermoglichen; (3) es sollte die 
Rekonf iguration und Datenverwal tung derart intelligent und schnell erf ol gen, 
daS sie ef fizient und einfach zu programroieren ist. 

5 

Bisherige Technologien verwenden entweder a) sehr kleine ALUs mit venig 
Rekonf igurat ionsunterstUtzung (FPGAs) und sind auf Bitebene ef fizient oder b) 
groSe ALUs (Camel eon) mit wenig Rekonfigurationsuntersttitzung, oder c) eine 
Mis chung aus grofien ALUs und kleinen ALUs mit Rekonf igurat ions untersttttzung 
10 und Datenverwal tung (VFUs) . 

Da die VFU-Technologie die leistungsfahigste Technik darstellt, soil auf ihr 
aufbauend ein optimiertes Verfahren geschaf f en werden. Es soli ausdrttcklich 
darauf hingewiesen werden, daS dieses Verfahren eben falls fUr die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Flachenaufwand zur effizienten Steuerung von Rekonf igurationen ist mit 
einer Menge von ca. 10.000 bis 40.000 Gattern pro PAS vergleichsweise hoch. 
Unterhalb dieser Gattermenge lassen sich in der Regel nur einf ache 
Ablaufsteuerungen realsieren, die die Programmierbarkeit von VFUs erheblich 
20 einschranken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofern auf eine besonders schnelle Rekonf iguration abgezielt wird, mtlssen 
zusatzliche Speicher vorgesehen werden, wodurch die erf order liche Gattermenge 
nochmals erheblich ansteigt. 

25 Um ein ordentliches Vernal tnis zwischen Rekonf igurat ionsauf wand und 

Rechenleistung zu erhalten, ist somit der Einsatz von groSen ALUs (viel 
Funktionalitat und /oder grofie Bitbreite) zwingend erforderlich. Werden die 
ALUs jedoch zu grofi, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4-bit) ist der Aufwand zur Xonf iguration 

30 aufwendiger Punktionen {z.B. 3 2 -bit Multiplication) zu hoch. Insbesondere der 
Verdr ahtungs au f wand wachst in kommerziell nicht mehr sinnvolle Bereiche. 



8XMD_ Rechenwerke 

35 Um ein ideales Vernal tnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdr ahtungs aufwand und der Konf iguration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken inner halb von ALU-PAEs (also 
insbesondere der in dieser Brfindung offenbarten PAEs, ebenso wie in PAEs 
nach DB 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen. Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dafi n einzelne BlOcke der Breite b 
a m/n entstehen. Durch Konf igurat ion wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in einen oder 
mehr ere BlOcke, jeweils gleicher oder unterschiedlicher Breite zerlegt sein 
soil. Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, da& 

45 inner halb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit f zerlegt in 1x16-, 1x8- und 2x4 -bit) . 
Die Daten werden derart zwischen den PAEs Ubertragen, daS die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbreite m zusanrmengefaBt werden 
und als Paket Ober das Netzwerk tlbertragen werden. 

Das Netzwerk Ubertragt immer ein komplettes Paket, d.h. alle Datenworte 
innerhalb eines Paketes, und werden nach dem bekannte Handshake-Verf ahren 
5 tlbertragen. Einzelne Datenworte innerhalb des Paketes konnen dabei auch 

unbenutzt sein, d.h, keine Information en thai ten. Dies kann durch zusatzliche 
Statusleitungen und/oder Handshakes ignaX en wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP Bussvsteme 

Fttr einen effizienten Einsatz der von SIMD-Rechenwerken 1st eine flexible und 
ef f iziente I&nsortierung der SIMD-WORD untereinander innerhalb eines Busses 
Oder z wie chen unterschiedlichen Buss en erforderlich. 

15 Die Busschalter nach Figur llktfnnen der art modifiziert werden, dafi eine 
flexible Verne tzung der einzelnen SIMD-WORD mSglich 1st. Dazu werden die 
Busse Ober beispielsweise Multiplexer, Busschalter, Transmissiongates , Pass- 
Transistor en (nachfolgend unter dem Begrif f Multiplexer zusammengefafit) 
entsprechend den Rechenwerken teilbar ausgelegt, der art dafi durch 

20 Konfiguration die Teilung bestiirtmt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondera 
n einzelne Multiplexer der Breite b = m/n. Es ist nunmehr mSglich, die 
Datenbusse fur b bit Breite zu konf igurieren. Durch die Matrixstruktur der 
Busse (Figur 11) ist die Umsortierung der Daten ebenfalls mBglich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch derart verkntipft, dafi ein gemeinsamer 
Handshake fur den neu geordneten Bus aus den Handshakes der ur sprung lichen 
Busse generiert wird. Beispielsweise kann ein RDY ftir einen neu sortierten 

30 Bus aus einer logisch en UND-Verkntlpfung aller RDYs der Daten ftir diesen Bus 
liefemden Busse generiert werden. Ebenso kann beispielsweise ACK eines 
Daten liefemden Busses aus einer DTJD-Verknapfung der ACKs aller Busse 
generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Implementierung geeignete Verkntipfungen dergestalt zu wahlen, dass diese den. 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Ausftihrungsvariante f inden die Verkntipfungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es m&glich, einem 
Bussystem der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake- Protokoll zuzuordnen. 

In einer weiteren besonders bevorzugt en Ausgestaltung werden eamtliche 
Bus systems in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) besteht nunmehr ein Ein-/Ausgangsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SJMD-Wortbreite 
von 8 tatsachlich 3x4 8bit Eingangsbusse und 2x4 8bit Ausgangsbusse. 
Jeder der Teilbusse weist bevorzugt s&ntliche verwendeten Handshake- und 
Steuersignale auf, beispielsweise RDY/ACK und der Reconfig -Trigger nach DE 
5 197 04 728.9 und ein globales Reset Signal, etc. 

Der Ausgang einer PAE versehdet bevorzugt dieselben Steuersignalen fur 
samtliche n Teil-Busse. Eingehende Quittierungssignale aller Teilbusse werden 
bevorzugt miteinander logisch verkntlpft, z. B. durch eine UND-Funktion. Die 
Bussysteme kSnnen jeden Teilbus frei verschalten und unabhSngig routen. Die 
10 Bussysteme und insbesondere die Busknoten verarbeiten und/ Oder verkntlpfen die 
Handshake-Signale der einzelnen Busse unabhangig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Da ten werden die Steuersignale samtlicher n 
Teilbusse der art miteinander verkntlpft, dass ein allgemeingultiges 

15 Steuer signal quasi als Bussteuersignal ftlr den Datenpfad generiert wird. 
Beispielsweise ktfnnen in einer "dependend" Betriebsart RdyHold-stufen fur 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche RdyHold- 
Stufen anstehende Daten signalisieren, werden diese von der PAE ubernaramen . 
In einer 'independend" Betriebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wodurch der Teilbus 
sofort fur eine nachste Datenubertragung frei ist. Das Vorbandensein aller 
erforderlichen Daten von alien Teilbussen in den Eingangsregistern wird 
innerhalb der PAE durch geeignete logische Verknttpfung der fur jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAE 

25 mit der Datenverarbeitung beginnt. 

Der wesentliche daraus resultierende Vorteil dieses Verfahrens ist, dass die 
SIHD-Eigenschaft von PAEs keinerlei besonderen EinfluS auf das verwendete 
Bussystem aufweist. Es werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) benStigt. Die Verschaltung selbst bleibt unbertlhrt. Die PAEs 
verkntlpfen und verwalten die Steuerleitungen lokal. Dadurch entfailt der 
zusatzliche Hardwareaufwand in den Bussystemen zur Verwaltung und/oder 
Verknttpfung der Steuerleitungen, 

35 Figur 11 zeigt einen mtiglichen und besonders bevorzugten Aufbau einer 

Busstruktur ftlr VPU-Architekturen. Die Ausgabeschaltung einer Funktionszelle 
z. B. (PAE , FREG/BREO) (1103, entspricht 0803a,b) ist tiber einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschal tungen der Funktionszellen (1101, 

40 entspricht 0801, 0802) fiber einen vertikalen Bus Inf ormationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Auf schaltung erfolgen kann. 
Wie in Fig. lla dargestellt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein "Auf trennen" eines Busses des horizontalen 

45 Bus systems 1102 und das Einfugen von horizontalen Schaltem (1112), die durch 
Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein ktSnnen. Abhangig von dem Wert eines Dekoders 
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und/oder Konfigurationsbits (angedeutet durch das Schal ter symbol 1113), das 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in einem 
Konfigurations regis ter der PAE angeordnet ist und konfiguriert wird, 
verbindet der Schal ter entweder die beiden Half ten des horizontalen Busses 
5 1102 miteinander oder schal tet den Bus 1111 auf die eine Halfte von 1102 auf, 
die andere Halfte von 1102 ist dann unterbrochen und wixd nicht 
weitergeleitet . Die Schal tung wird bevorzugt fur jeden Bus des horizontalen 
Bussystems verwendet. 

Pigur lib zeigt die entsprechende Schal tung zona Abgriff von Daten von 1102 

10 und zur Weiterleitung derer an 1101. Ober vertikale Schal ter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder ahnlicnen geeigneten 
Bauelementen realisiert sein kOnnen, werden Daten bitweise von den Bussen des 
horizontalen Bussystems (1102) abgegrif fen und auf den vertikalen Eingangsbus 
(1121) zur Eingabeschal tung 1101 ubertragen. Die Ansteuerung der vertikalen 

15 Schal ter, d.h. ihre Schal tfunktion, erfolgt durch Dekoder und/oder 
Konfigurationsbits (angedeutet durch die Schal tersymbole 1123) , die 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in 
Konfigurationsregi stern der PAE angeordnet sind und konfiguriert werden. 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a las sen n:l 

20 Datenubergange zu, d.h. mehrere Busse kOnnen zu einem Bus zusammengefafit 
werden, d.h. die Daten roehrer Busse werden auf einem Bus zusammengef tthr t . 
Fig. 11c zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
(1102) . Jeder horizontal e Bus einzeln und je fur sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden. Bine Auftrennung kann durch 

25 Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soil. 
Je nach Konfigurationsbit 1132, das bevorzugt fur jeden Bus des Bussystems je 
einzeln zur Verfugung stent, wird die DatenObertragung auf das 
danebenliegende Bussystem (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schal tern nach Figur 11a 

30 realisiert, indent die Information des Konfigurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) ubertragen wird und 
entsprechend die Schalter zur Weiterleitung ermachtigt (enabled) oder die 
Schalter sperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bussystem entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschal tung 1101. Jede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhangig geroutet werden konnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Ver schal tung wird 
dadurch erreicht, dass die Schalter nach den Figur en lla-c fur jeden Bus 
der art getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltet' wird. Dadurch ist das Bussystem feingranular 
verschal tbar . 



35 



WO 03/036507 



PCT7EP02/10572 



Figur 12b zeigt eine SIMD-Datenverarbeitung , bei welcher samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb einer 
PAE in die Teilbusse getrennt und in den SIMD-ALUs (1213, 1214) getrennt 
verarbeitet. Die gemeinsamen Handshakes steuern die Ablaufsteuerung (1215) 
5 der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
vollkommen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223, 1224) getrennt verarbeitet. Die getrennt en 
0 Handshakes steuern die Ablaufsteuerung (1225) der PAEs an, bzw. werden von 
dieser generiert. 



Einsatz von FFQAs als ALU-Core 

In PACT 13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA oder FPGA-ahnliche Struktur in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAE gemafi den FPGA Konf igurationsmethoden nach 
dem Stand der Technik konfiguriert, d. h. die erwe iter ten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden auf die FFGA- 
Struktur keine Anwendung. Dadurch sind Auf wand und Kosten far die 
Konfigurationssteuerung der verhaitnism&Big kleinen FPGA- Z ell en gering. Die 
PAE allerdings, die. die FPGA- Z ell en enthalt, verhalt sich gemafi des VPU- 
Konfigurationsverfahrens nach den o. g. Schriften. Dadurch- ist die FPGA- 
Struktur in der PAE- Struktur gekapselt und verhalt sich wie ein PAE-Objekt 
mit vielen Konf igurationsregis tern. 

Dadurch las sen sich auch beliebige Operation en auf ein Array aus FPGAs 
abbilden. Gemafi DE 101 35 210.7-53 ist eine Mischung aus ALU-PAEs und FPGA- 
PAEs innerhalb einer VPU moglich und durchaus sinnvoll. 

Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konf igurationsregis tern fur die FPGA- Z ell en sinnvoll ist, da der en Anzahl 
sehr hoch ist. Gegebenenfalls werden Konf igurationsregis ter zum schnellen 
Umkonfigurieren einer FPGA- PAE gemaS DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File oder FIFO- 
Struktur innerhalb der PAE realisiert und von dort aus in die FPGA-Zellen 
geladen . 

Es hat sich mittlerweile als besonders vorteilhaft herausgestellt, wenn 
innerhalb einer ALU- PAE eine FPGA Struktur der ALU zugeordnet wird, indem die 
FPGA- Struktur vor und/ oder nach und/ oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine AusfOhrung in welcher die FPGA- Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA- Struktur en verwendet 
werden rattssen, da samtliche arithmetischen Operationen weiterhin in der ALU 
ablaufen. Dadurch wird eine besonders hohe Kos ten/Performance Effizienz 
erreicht. Vm kleine Wortbreiten zu unterstutzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschrieben en SIMD-ALUs einzusetzen. 
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Durch die Nachschaltung von FPGA- S truktur en hinter einer ALU lass en sich 
insbesondere Correlatoren und FNG-Generatoren besonders effizient aufbauen. 

Der Einsatz von VPU Architekturen bietet sich mittlerweile' insbesondere fttr 
5 den Ersatz von ASICs bei mittleren und niederen Stttckzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf, dass die 
Applikationsf elder sehr klar def iniert sind und haufig nur einige wenige 
Applikationen auf den Bausteinen ausgefOhrt werden . Besonders diese 
Einsatzgebiete benfltigen haufig feingranulare FPGA-Strukturen zur bitweisen 
0 Verarbeitung von Da ten. 

Durch die Limit ierung auf wenige Anwendungen sind hier die m&glichen 
Konfigurationen der PPGAs ebenfalls sehr begrenzt und vorhersagbar . 
Es wurde erkannt, dass es beispielsweise insbesondere fur diese 
Einsatzgebiete lohnend ist, die Reconfiguration der FPGA-Strukturen von der 
5 schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Wort en werden fur die FPGAs langsamere (z. B. herk5mraliche serielle) 
Rekonf igurationsverfahren verwendet, die au&erst kosten- und f lachenef f izient 
realisierbar sind. 

Dazu kann (1) ein vollkomraen separates Konfigurat ions system bestehend aus 
0 Bussystem und Konf igurationskontrollern aufgebaut werden, wie dies von FPGAs 
nach dem Stand der Technik bekannt 1st. (2) kflnnen die 

Konf igurationsressourcen der VPU Technologie benutzt werden , ohne dass jedoch 
Ressource fur besondere beschleunigende Massnahmen zur Verfttgung gestellt 
werden. Beispielsweise kann der Zugriff auf den FILMO nach'DE 196 54 593.5-53 

5 , DE 198 07 872.2 fur FPGA-Strukturen ausgeschlossen sein, ebenso wie das 
Vorhandensein von Konfigurationsregisters tacks nach DE. 100 28 397.7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Dnterstutzung der schnellen Wave- 
Rekonfiguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa miiglich, einem FPGA-Array eine PAE zur Umkonf igurierung zuzuordnen. Hier 

[) nrufi lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 
was wie vorstehend beschreiben, durch PAE-gesteuerten, eigenstandigen Zugriff 
auf Da ten von auflen geschehen kann. 

Insbesondere bietet es sich aus Kostengrtuoden an anstatt der mehrfach 
rekonf igurierbaren Architekturen ressourcensparende 'eininal konfigurierbare' 

5 Architekturen einzusetzen. Die VPU- Bausteine werden einmal vor ihrer 

Auslieferung an den Kunden oder beim Kunden bzw. durch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre durchzuftlhrende 
Funktion konfiguriert. Die Funktion der FPGA-Strukturen ist eodann im 
weiteren unabanderlich, wahrend samtliche verbleibenden Funktionen, wie die 

[) der ALUs und der en Vemetzung, weiterhin vollstandig laufzeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf igurier bare" Technologien bieten sich besonders die bekannten 
ROM, EPROM, EE PROM/ FLASH basierenden Verfahren an. Es soil insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Antifuse-Verfahren (z.B. 
5 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger "einmal 
programmierbarer ■ FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derartiger Strulcturen soil hier nicht welter 
eingegangen werden, da dieser durch den einschlagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firraen, hinreichend bekannt ist. 

Figur 8 zeigt beispielhaft eine erf indungsgemaSe PAE. Dargestellt ist der 
Dafcenpfad der PAE. Die Verbindung zu dem Bus system 0105 wird durch die 
bevorzugt Register enthaltende Bingabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 real isiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus f eingranularen 
FPGA-Zellen (0805), die Ober einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur aufgeschaltet, die 
Busstruktur wiederuzn ist mit 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Bypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 
In die FPGA-Zellen konnen mehrere Stufen Logik konf iguriert werden, 
insbesondere sSmtliche oder einige der folgenden Funktionen; Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister, 
Register, Boolsche Lookup-Tabellen . 

Die FPGA-Zellen (0805) kdnnen durch den Konf igurationsbus (0404) der PAE 
konf iguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 
Baugruppen, wie z. B. Konf igurationsstacks (0406) nicht zur Konf iguration von 
FPGA-Zellen benutzt. Diese Baugruppen werden ggf . fur derartige 
Konf igurationsda ten passiv geschaltet oder die Konfigurationsdaten werden an 
ihnen vorbeigeleitet. 

In einer besonderen Ausgestaltung ist eine permanente einmalige Konf iguration 
der FPGA-Zellen unter Verwendung von ROM-Element en wie z. B. EPROM, EEPROM, 
Flash-ROM oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt mogliche erf indungsgemaEe Ausgestaltungen von PAEs. Es soil 
ausdrticklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE implementiert 
sein kflnnen. 

Figur 9a zeigt den AnschluS eines Registerfiles (0901) (z.B. R0..Rn) an einen 
Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Regis tern 0901 gefuhrt und dort je 
nach Operation eingespeichert . Die Register 0901 werden uber Muliplexer 
(0903, 0904) je nach durchzuf uhrenden Operation auf die Eingange der ALU 
gefuhrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche 
Aufschalteinheit (0911) fur einen dedizierten globalen Bus (0912) (z.B. 10- 
Channel) implementiert ist. Die Ergebnisdaten des Kerns werden zu der 
Aufschalteeinheit 0911 gefuhrt und dort je nach Operation, auf den globalen 
dedizierten Bus (0912) ubertragen. Fur die PAE bestimmte Daten von 0912 
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werden ttber Muliplexex (0903, 0904) je nach durchzuf Ohrenden Operation auf 
die Eingange der ALU geftihrt. 

Optional kann die Aufschalteeinheit 0911 fiber die Busauf schalteeinheiten 0913 
und 0914 Da ten direkt von dem Bus system 0105 lesen oder auf dieses 
5 tlbertragen. 

Figur 10a zeigt die Verwendung von dedizierten globalen Bussystemen innerhalb 
eines Arrays aiis PAEs (1001). Inscweit entspricht die Darstellung des PAs aus 
Figur 1 (0101) . Jeweils eine Menge von PAEs (1001 J ist an die globalen 

10 dedizierten Bussysteme 1002, 1003, 1004 angeschlossen und kann Daten auf 
diese Senden oder von diesen anpfangen. Die DatenObertragung kann sowohl 
zwischen den PAEs, als auch zwischen PAEs und IO stattfinden. Es ist 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bussysteme 
gleichzeitig angeschlossen sein konnen, wahrend andere PAEs moglicherweise 

15 keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den AnschluS eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an aufierhalb des 0101 liegende, 
ggf . auch bausteinexteme Baugruppen. Die Baugruppen kfinnen beispielsweise 

20 Peripherie (1011) und /oder Speicher (1012) sein. Zum AnschluS der aufierhalb 
1 leg end en Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTIi, LVDS, etc.) stattfinden. 

Figur 10c zeigt ein Beispiel ftlr den AnschluS eines globalen dedizierten 
25 Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine Inter face- 
Baugruppe (1021). Die Interf ace-Baugruppe ubersetzt die Protokolle und/ oder 
Signale des internen dedizierten Busses auf einen oder mehrere aufierhalb 
li eg en den Busse. In dem aufgezeigten Beispiel sind 2 aufierhalb liegende Busse 
30 (1022, 1023) implement! ert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicher bus system ftlr speicher 
(1024) wie SDR-RAMs, DDR-RAMs, RAMBUS o.a. sein, wahrend 1023 ein 
Peripheriebussystem fur Peripherie- und /oder IO-Gerate (1025) darstellt, wie 
z. B. PCI oder ein serielles Protokoll wie USB, FireWire, Ethernet. 

35 

Konf iquration komolexer Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) konnen durch die 
geeignete Verschaltung und Gruppierung von konf i gur i erbar en Zellen (PAEs) 
40 moglicherweise auch unterschiedlicher Bauart (RAH- PAEs , ALU- PAEs, Bus sen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von mehreren ALU- PAEs, die die arithroetischen Operationen ttber 
Exponent und Mantisse durchfuhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des Anmelders (XPP-Technologie ) integrierten Forward- und 
Backward-Register (FREG/BREG) zugeordnet, urn die notwendigen Normierungen 
durch Schiebeoperationen der in den FREG/BREG angeordneten Barrel -Shifter 
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durchzuftihren. Damit lass en sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Fiachenef f izienz aufbauen . 
Bin Vorteil des Verfahrens liegt Sarin, dass keine Siliziuro-Flache fOr fest 
integrierte Floating-Point Rechenwerke verwendet werden muss. Da Floating- 
5 Point-Operationen relativ zu den Integer-Operationen nur s el ten gebraucht 
wird, steigt damit das Kos ten /Nu tz en- Vernal tnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU ttbersetzen, kbnnen durch 
Makroexpansion und/oder mittels Laufzeit-Bibliotheken entsprechende 
vorgefertigte komplexe Strukturen in den Mas chin encode (z. B. NML) 
10 ubernehmen. 

Fur Mas chinenc ode- Programme (z. B. NML) bieten sich besonders Library-Calls 
auf Bibliotheken an, die die entsprechenden komplexen Funktionen vorgefertigt 
en thai ten, 

15 

Statema chines tiber RAM- PAEs 

Mit einera Array aus PAEs verbundene RAM-PAEs konnen zum Aufbau von Sequenzern 
eingesetzt werden. Das Grundprinzip beruht darauf , dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zurttckgekoppelt wird. Die ROckkopplung 
erfolgt bevorzugt Uber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Teile der Ausgangsdaten (CONTROL- Signal e) kdnnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an externa Gerate ubertragen 
werden, urn dort best innate Vorgange auszulosen. Besonders bevorzugt sind zwei 
tiber tragungsar ten, die zunteist gemeinsam angewendet werden: 

a) die ttbertragung Ober ein en Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemafi der vorstehenden Eriauterung ausgestaltet, wodurch eine teilweise 
Obertragung der Ausgangsdaten besonders effizient realisierbar ist. 

b) die Obertragung Ober einen Triggerbus, dessen bevorzugt e Ausgestaltung und 
Arbeitsweise in PACT 08 beschrieben ist. Ober Triggerbus se konnen Zust&nde und 
Bedingungen zur Ablauf s teuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch extemen Geraten besonders effizient ubertragen werden. 

35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt(Darstellung: hoherwertige Bits ... niederwertig Bits): 
Adresse : 

Adresse des aktuellen Zyklus I 



20 



25 



30 



Da ten: 

Adresse des nachsten Zyklus 



40 



CONTROL- Signal e 



Es bleibt zu erwahnen, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend zugegriffen. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konf igurationseinheit 
vorkonfiguriert. Deshalb kann der Speicher insbesondere auch als 
45 nichtfluch tiger einmal prograimnierbarer Speicher mit ROM, EPROM, EEPRQM, 
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Flash Z ell en Oder basierend auf Fuse oder An ti fuse Technologien aufgebaut 
sein. Der Speichex wird dann, wie vorab bereite beschrieben, vor der 
Auslieferung an den Kunden oder beiin Kunden personal isiert* d.h. 
pr ogrammi er t . 

Bin Speicherzugrif f durch andere PAEs ist grundsatzlich raSglich, urn den 
Sequenzer z.B. im Betrieb zu modifizieren, soli aber aufgrund des begrenzten 
Einsatzbereichs hier nicht welter detailliert ausgeftthrt werden. 



10 Der erfindungsgemaSe Sequenzer kann durch folgende Erwei t erungen in seiner 

Abfolge von Zyklen auf Ereignisse reagieren und insbesondere bedingte Sprtinge 
durchf tihren : 

Bin Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang fur weitere Zustandssignale verwendet. Diese Zustands sign ale 

15 konnen durch die vorstehenden tibertragungsarten Ubertragen werden und sorait 
Daten oder Trigger sein. Bei der Selektion des nachf olgenden Zyklus wird 
nunmehr eine mogliche Menge von Zyklen durch die Datenruckkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der bestiromte Zyklus wird dann aus 
der mSglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 

Daraus resultiert fol gender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung: holierwertige Bits ... niederwertig Bits): 
Adresse: 



25 



Adresse des 
aktuellen Zyklus 



Zustands si gnale 



Daten: 

Adresse des nachsten Zyklus | CONTROL- Signal e 



30 



Somit ist ein vollwer tiger Sequenzer definiert, der den Grundprinzipien der 
Mealy-Moore Sequenzem entspricht. 



Die Zustandssignale und/oder Control-Signale konnen nunmehr ggf . zu BOndeln 
zusairaiengef afct der art gruppiert werden, dass je eine Gruppe bestimmt en 
Sendem/Bmpf angem zur VerfOgung steht, z.B. eine Gruppe fur 01 01 -interne 
PAEs und eine Gruppe f Or exteme Baugruppen und eine Gruppe zur 
35 Konfigurationseiaheit. 



Mit anderen Worten werden samtliche SprOnge durch die Angabe der "Adresse des 
nachsten Zyklus" realisiert. Bedingungen werden durch die Zustandssignale 
realisiert. 

Das dabei auftretende Problem 1st, wie sog. don't cares, also bestimmte 
Zustandssignale, der en Wert zu ein em Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fur samtliche mOglichen Werte 
dieselben Daten festzulegen. 
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10 



Beispiel : 

Innerhalb einer f olgendermassen aufgebauten Adresse 



Adresse des 
aktuellen Zyklus 



Zustandssignale 



soli die "Adresse des aktuellen zyklus - (Cycle) beisplelhaft gleich 0x60, 
entsprechend CYCLE60 sein. Es sind 4 Zustandssignale (ZS0..3) vorgesehen, von 
denen innerhalb des beispielhafte Zyklus' 2 (ZS3 und ZS1) je nacb Wert zu 
anderen Sprungzielen fuhren, also beisplelhaft nach CYCLB10, CYCLE7, CYCLES 9 , 
CYCLES 6 . 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


zso 




CYCLES 0 


0 


? 


0 


? 


CYCLE10 


CYCLE60 


0 


? 


1 


? 


CYCLE7 


CYCLE60 


1 


? 


0 


? 


CYCLES 9 


CYCLE60 


1 


? 


1 


? 


CYCLES 6 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einf lufi auf die Zuordnung der Adresse zu den Daten bat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


zso 




CYCLE 60 


0 


0 


0 


0 


CYCLE10 


CYCLE60 


0 


0 


0 


1 


CYCLE10 


CYCLE60 


0 


0 


1 


0 


CYCLE7 


CYCLE60 


0 


0 


1 


1 


CYCLE7 


CYCLE60 


1 


0 


0 


0 


CYCLE89 


CYCLE60 


1 


0 


0 


1 


CYCLES 9 


CYCLE60 


1 


0 


1 


0 


CYCLES 6 


CYCLE60 


1 


0 


1 


1 


CYCLES 6 


CYCLES 0 


0 


1 


0 


0 


CYCLE10 


CYCLE 60 


0 


1 


0 


1 


CYCLE10 


CYCLE60 


0 


1 


1 


0 


CYCLE7 


CYCLE60 


0 


1 


1 


1 


CYCLE7 


CYCLE60 


1 


1 


0 


0 


CYCLES 9 


CYCLE60 


1 


1 


0 


1 


CYCLE89 


CYCLES 0 


1 


1 


1 


0 


CYCLES 6 


CYCLES 0 


1 


1 


1 


1 


CYCLES 6 



15 

Jeder Zielzyklus 1st nunmehr 4-fach gespeichert, entsprechend alien binaren 
Kombina t ionsmttgl ichkei ten der don't care. 



Eine weitere optional e, aber sinnvolle und daher bevorzugte 
20 AusaestaltungsmOgl ichkei t des Sequenzers sieht einen zusStzlichen Teilbereich 
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der Ausgangsdaten ftir eine Selektor- und/oder Vergleichsmaske fur die 
Zustandssignale vor. Bel der Verwendung als Selektor kfinnen z.B. durch die 
Ansteuerung von Multiplexera durch die Selektormaske eine Teilmenge von 
Zustands signal en aus mehreren maglichen ausgewahlt werden. Die zusatzliche 
5 optionale Vergleichsmaske kann als Vergleichsoperator fUr einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signal en dienen, z.B. uber eine normale Maskenoperation durch 
Verundung nach dem Stand der Technik (siehe PACT10). 

10 

Der Aufbau der Ausgabedaten ist dann wie folgt; 



Da ten: 



Adresse des nachsten 


CONTROL- Sign ale 


Selektor /Vergleichsmaske 


Zyklus 







15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Sequenzerspeicher verwendet wird, wird 
in mehrere Teiladressen beliebiger und insbesondere mSglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 fur eine erste 
20 Teiladresse (NEXT_CYCLE) , Bit 4.. 7 fOr eine zweite Teiladresse (SBO_IN) und 
Bit 8.. 12 fttr eine drltte Teiladresse <CTRL_IN) . 

Der Datenausgang einer RAM-PAE wird in mehrere Teildaten beliebiger und 
insbesondere mtfglicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fur die ersten Teildaten (CYLCE) , Bit 4.. 7 fttr die 
25 zweiten Teildaten (SEQ^OUT) und Bit 8.. 12 fur die dritten Teildaten 
(CTRL_OUT) . 

Zur Auf teilung der Adreasen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAE erfolgen. 

Der RAM-PAE kfinnen datenverarbeitende PAEs zugeordnet werden, wie z. B. ALU- 
PABs. 

35 Die Festlegung des nachsten Zyklusses innerhalb eines Sequenzer durchlaufs 
erfolgt durch die RClckkopplung von NEXT_CYCLE auf CYCLE. 

In einer erweiterten Ausftthrungsvariante kflnnen zusatzliche 
datenverarbeitende PAEs zur Berechnung von CYCLE in Abhangigkeit von 
40 NEXT_CYCLE innerhalb der Rttckkopplung vorgesehen sein. Diese PAEs kOnnen auf 
beliebige r insbesondere auch zusatzliche Signale, Daten oder Zustande 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagieren . Desweiteren 
konnen diese PAEs zusatzliche Signale Oder Daten erzeugen. 
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Zur Realisierung eines erwe iter ten Sequenzers k6rmen weitere PAEs angekoppelt 
sein, die in einer mSglichen Auegestaltung auch in ihrer Funktion und/oder 
Vernetzung vam Sequenzer beeinflu&t werden kfinnen. Dazu kann der Sequenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs ubertragen. Ein 
5 Zugriff auf die Konf igurationsregister kann beispielsweise durch die in DE 
197 04 728.9 beschriebeno Architektur erfolgen (vgl. DE 197 04 728.9, Fig. 
4). Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen Anschlufi an weitere PAEs, insbesondere datenverarbeitende (ALU- PAEs) 
und/oder Speicher-PAEs {RAM- PAEs) und/oder periphere Anschlusse (10- PAEs) . 
10 Diese PAEs k6nnen durch die durch SEQ_OUT dargestellten Control-Signale 
angesteuert werden und konnen bedarfsweise durch die an SEQ_IN geleiteten 
Zustandssignale Ablauf speicher des Sequenzers ansteuem. 

15 Weitere mSglicherweise auch unabhangige PAEs oder Einheiten, insbesondere 

auch externe /periphere Einheiten und/oder ubergeordnete CTs kdnnen durch den 
Sequenzerspeicher entsprechend SEQ_IN/OUT angesteuert werden (CTRL__0UT) oder 
dies en ansteuern (CTRL_IN) . 

20 

Zur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
Rttckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kann durch eine ubergeordnete Konf igurationseinheit konfiguriert 
25 werden, insbesondere kdnnen die Sequenzer funktionen durch den Xnhalt der RAM- 
PAE konfiguriert und festgelegt werden. 

Es wurde als vorteilhaf t erkannt und wird fur sich als paten tfahig gehalten, 
dass mit einem Speicher ein einfacher Sequenzer ohne grofien zusatzlichen 

30 Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch moglich, 
dass zunachst der Inhalt einer Speicher zelle dahingehend ausgewertet wird, an 
welcher Stelle als nachstes ein Lesezugriff erfolgen soil. Wenn dort wieder 
angegeben 1st, wo als nachstes ein Zugriff erfolgt, ist ein automatenartiges 
Durchlaufen realisierbar. Zugleich wird aber gemaS der hier als vorteilhaf t 

35 erkannten Ausgestaltung nicht einfach eine weitere Adresse fur den n&chsten 
Zugriff ermittelt, sondem parallel dazu angegeben, was dabei zu tun ist; mit 
anderen Worten werden an der Speicher adresse auch Daten oder Befehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fur den n ache ten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

wei teres mOglich, wenn die Breite der gespeicherten Daten aufgetellt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
moglich, nur einen Teil der im speicher adressierbaren Speicherplatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden . Dann kiJnnen weitere 

45 Bits hinzugefUgt werden, hier vier, etwa durch Auswertung von Flags, 

Triggem, Zustanden, Oberlaufen etc. Dies hat den Vorteil, dass an die 
Speicher st ell en, die dann exakt angesprochen werden durch Vbrgabe der hier 
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8bitigen ausgelesenen Adresse und der hier 4bit auswertegenerierten 
Information, unterschiedliche Anweisungen gesetzt weird en konnen. Es sei 
darauf hingewiesen, dass entweder alle Trigger und die erf orderliche Reaktion 
hierauf von vorneherein f estlegbar sind odex dass alternativ auch zumindest 
5 Teile der Reaktionen auf einzelne oder alle Trigger wahrend der Ausfuhrung 
einer Konf iguration variiert und /oder festgelegt werden kSnnen. Hierzu kann 
eine RticKkopplung auf eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhangig von den ausgewerteten Inf onnationen bedingte 
10 Sprttnge etc. zu generieren. Sind dabei von einer Reihe per- se auswertbarer 
Informationen nur wenige inter ess ant, werden also aktuell im obigen Bei spiel 
etwa nur 2 statt vier Bite benotigt, so kann die jeweils in einer 
entsprechenden Speichers telle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die eich nur um nicht interessierende Bits in ihrer 
15 Adresse unterscheiden. 

Pigur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemaSen Sequenzers 
basierend auf einer RAM-PAB, Ein Teil (1505) des Datenausgangs (1502) eines 
Speichers (1501) 1st uber ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers zurttckgekoppelt. Der Adresseingang (1504) 
entspricht somit CYCLE und 1505 einero Teil, bevorzugt dem Hdherwertigen, von 
NEXT_CYCIiE. 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 
25 Maskeneinheit (1509, 1510) geftthrt werden, in welcher die vom Bus system 0105 
als Daten und/oder Trigger eingehenden SEQ_IN (1511) bzw. CTRI^IN (1512) 
Da ten verarbeitet werden. 

CTRL_IN und SEQ_IN und/oder deren in der Selektor-Maskeneinheit verarbeitete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 1505 den 
hoherwertigen Adressteil und CTRL„IN/SEQ_IN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SEQ_OOT- (1506) 
und CTRluOUT (1507) Teil aufgetrennt werden und uber die Ausgabebaugruppen 
35 08 03a, b als Daten und/oder Trigger auf das Bussystem 0105 geftthrt . 

Verschiedene Konfigurationsregistermodelle zur Festlegung der Konf iguration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 1st ein 
sequent iell abarbeitbares Modell beschrieben, in PACT0 4 ist ein FIFO-Modell 
40 beschrieben, das ebenfalls sequent! ell abgearbeitet und uber 1 append 

konfiguriert werden kann, in PACT08 ist ein selektives Modell beschrieben, 
bei welchem abhangig von der Datenverarbeitung bestiinmte 

Konfigurationsregister und damit die in ihnen gespeicherte Funktion und/oder 
Vernetzung ausgewahlt werdeti. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Modell beschrieben, das sich besonders fur die Vorabkonf iguration und 
uberlappende Konf iguration eigne t. 
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Als besonders leistungsfahig und Koe ten/Performance effizient wurde eine 
Mis chung aus dies en Model 1 en erkannt. 

Das FIFO-Model 1 nach DE 100 28 397.7 eigne t sich besonders, urn eine 
5 beliebige Anzahl von Konf igur at ionsregi stern von PAEs vorzuladen, da die. 
Funk t ion des verwendeten FIFOs eine variable Konf igurationBlange effizient 
enaoglicht. Hierzu wird jeder PAB ein lokaler FIFO-Speicher zugeordnet, der 
die Konfigurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweiterung, wie z. B. die nachfolgend beschr iebene , des FIFO- 
Model les kann der Anfang und das Ende einer bestimmten Configuration und der 
dazugeh&renden einzelnen Konf igurationseintr&ge festgestellt werden. Nunmehr 
konnen mehrere Konfigurationen zugleich in dem FIFO-Modell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des An fangs oder Endes von 

Konfigurationen haben sich die zwei nachfolgend beschr iebenen Verfahren 
herausgestellt : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle: 
20 vJedem Konfigurationseintrag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf iguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0..15 


Bit 16 


Bit 17 


Konfigurationswort 


0=don't 

care 

1= Beg inn 


0*don' t 

care 

l»Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konfigurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0..15 


Bit 16 




Konfigurationswort 


O^don't 

care 

l=Ende 



b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden; 
30 Bestimmte Bitkoiabinationen innerhalb des Konfigurationswortes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kdnnten die folgenden Befehle implementiert sein: 
BEGIN : Beginn einer Konf iguration 
END : Ende einer Konf iguration 
35 Dieses Verfahren ist erheblich flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einf achen Unterscheidung von Befehlen und Konfigurationen kann ahnlich 
den CycleBi ts ein Bit vorgesehan sein, das durch seinen Wert die Semantik der 
Konfigurationswortes bestiiamt, beispielsweise wie folgt: 



Bit 0..15 


Bit 16 


Daten 


O=lnterpretation der Daten als 




Konfigurationswort 




l=Interpretation der Daten als 




Befehl 



5 Bine Konf iguration wird je Aufruf von ihrem An fang bis zu ihrera Ende in die 
Konfigurationsregister einer PAE Obertragen. 



Durch eine optionale zusatzliche Obersetzungs- und Zuweisungsvorrichtung 
kannen Zustande (z.B. Zustande der eigenen ALU und/oder ein oder mehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestinnate 
Konfigurationen innerhalb des FIFO-Modells tibersetzt werden. Beispielsweise 
kann ein ein tref fender Rekonfigurat ions trigger auf eine bestimmte 
Konf iguration innerhalb des FIFO-Model Is zeigen, die durch das Auftreten des 
Rekonfigurations trigger dann konfiguriert wird. 

15 

Als flbersetzungs- und Zuweisungsvorrichtung kttnnen beispielsweise 
algebraische Berechnungen und/oder logische Verkntipfungen und/oder bevorzugt 
Ubersetzungsspeicher (Lookup-Tabellen) zum Einsatz koramen. 

20 Wenn verschiedene Konfigurationen in einer oder fur eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einfache Weise dadurch zu verwalten, 
dass die Langen der jeweiligen abgespeicherten Konfigurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konfigurationen unterschiedliche 

25 Langen haben, etwa weil bei bestimmten Konfigurationen Busse und/oder 

Register, wie Vorwarts- und Rtickwartsregister konfiguriert werden nrQs sen und 
bei andere nur neue Funktionen der ALU einer PAE einzustellen sind, oder weil 
glelchzeitig Konfigurationsinformation fur zellexterne Einheiten roitverwaltet 
wird. 

30 

Es 1st darait also zn&glich, einen Quasi -Fifocharakter zu implementieren. Dann 
soli ten Mitt el zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konf igur at ions langen, sowie dafOr, bei Uberflttssigwerden bestimmter 
Konfigurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
mGglich. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konfigurationen zu 
verwalten bzw. wiederum einen Seguenzer zu implementieren . Wiederum kann so 
40 auf die Konfigurationen reagiert werden, dass sich Sprtinge etc realisieren 
lassen. Es sei darauf hingewiesen, dass oben bereits erwahnt wurde, dass zur 
Realisierung von Sequenzern zwischen ALU- PAEs und/oder anderen 
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datenverarbeitenden Zellen mit jeweils gegebenenfalls exweiterter 
Funktionalitat und Speicherzellen Steuer( Command-) Lei tungen vorgesehen werden 
kfinnen. Es sei erwahnt, dass derartige Lei tungen mit zugeordeten Steuexungen 
auch innerhalb einex einzelnen und fur sich autark seqeunzerfahigen PAB 
5 vorgesehen eein kfinnen. 



Eine besonders bevorzugte Variante ist in Figur 14 dargestellt und arbeitet 
wie folgt: 

10 Eine Kette von Addierem wird derart miteinander verbunden, dass das Ergebnis 
(SDMME) eines vorherigen Addierers (p) an einen nachfolgenden Addierer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedera Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SDMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konf igurations-PIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition last sich nun 
berechnen, indem samtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konf igurationen auf addiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Wort en ist die relative Position als unterste Konf iguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnis ausgang der 
25 Addiererkette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gem&S ihrer Anordnung im FIFO. 

Die Kette wird an der S telle durch einschleusen einer Null ans telle der SUMME 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konf iguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem Lesepo inter des FIFOs, der 
auf die unterste Konf iguration zeigt, und der Startposition der selektierten 
Konf iguration. 

Somit ist die Sprungadresse zur selektierten Konf iguration einfach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konf iguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kOnnen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden fiber eine Lookup- Tabelle Obersetzt und 
danach m6glicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. tlber 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konfiguration. Dies ist insbesondere dann wichtig, wenn eine Wave- 
Rekonfiguration nach PACT08, PACT13, PACT17 durchgefuhrt werden soli, bei 
we 1 cher bevorzugt ein mit den Daten ttbertragener Trigger-Vektor die nachste 
Konfiguration selektiert. 

5 

Nach Oder w&hrend der Konfiguration konnen Konf igurationen aus dem FIFO 
entfernt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
tibersetzungs- und Z uw e i s ung svor r i ch tung entsprechend angepasst. 

10 

Weiterhin kann das FIFO-Model 1 urn das Sequenz er-Verf ahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwahnt zu 
sein, deren parallel e) oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise SprQnge (GOTO) , sowie zustandsabhangige 
15 und bedingte Sprunge (WAIT-GOTO, IF-GOTO) eingeftthrt. Sprunge kdnnen durch 
besondere CycleBits reprasentiert werden, oder bevorzugt als Befehle 
inpleraentiert sein. 

Weiterhin kann ein Synchronisationsanzeigeverf ahren verwendet werden, das 
20 anzeigt, wann eine bestimmte Konfiguration bzw. ein bestimmter Zyklus des 
Sequenzers beendet ist. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konfigurationseintragen bestehen. Zur Kennzeichnung kann beispielsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei •run' 
zusainmengehdrende Konf igurationseintrage eines Zyklus kennzeichnet und 'stop' 
25 den ersten Eintrag eines nachfolgenden Zyklus; alternativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits raoglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich verhalten. 

Alternativ oder zusatzlich zu dies en Verf ahren kiJnnen auch die ebenfalls aus 
30 den frUheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden. 

Durch 'stop 1 oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. eine Konfiguration ist komplett, kann ausgefuhrt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konfiguration wird der nachste 
Zyklus ausgefuhrt. 

Die Beendigung kann entsprechend sequentieller Prozessoren durch einen Takt 
(Instruktionssequenzing) definiert sein, und/ oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konf igur at ions sequenz ing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 'stop' 
45 ubersprungen werden und die nachfolgenden Konf igurationen konf igur iert 

werden. Alternativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nicht nur die lokal zugeordnete PAE ansteuera, sondern 
auch weitere, insbesondere umliegende oder zur selben Konf iguration gehoxende 
PAEs. 

5 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

AusfOhrungsbeispiele: 
10 A) Ein ein tref fender Trigger wird Ober eine fiber setzungs- und 

Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (Kl) ubersetzt. 

Die Konf iguration (Kl) wird daraufhin in die PAE konf iguriert. Als Ende- 

Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 

run/ stop-Flag dienen. 
15 Ein nachfolgend ein tref fender Trigger wird uber eine Cbersetzungs- und 

Zuweisungsvorrichtung auf eine andere im FIFO liegende Konf iguration (K2) 

ubersetzt. Diese Konf iguration (K2) wird daraufhin in die PAE konf iguriert . 

Kl und/oder K2 konnen nach erfolgter Konf iguration in die PAE aus dem FIFO 

geloscht werden. 

20 

B) Ein ein tref fender Trigger wird tlber eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (K3) ubersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konf iguriert und ausgefuhrt. Als Ende-Kennung 

25 kann beispielsweise ein WAIT-Befehl oder das run/stop-Flag dienen. 

Ein nachfolgend eintref fender Trigger, der das Ausfuhrungsende des Zyklus 
anzeigt, bewirkt die Konf iguration und das Ausfuhren von Cy2 . Cy2 endet mit 
zwei WAIT-OOTO-Befehlen (WAIT-GOTO (Trgl , Cy3a) ; WAIT-GOTO {Trg2, Cy3b) ) 
(vgl. PACT04), dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 

30 Ausfuhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten .Zyklus Cy3a konf iguriert und ausgefuhrt bzw. bei Trg2 
entsprechend Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das Ausfuhrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konf iguration entsprechend konf iguriert und ausgefuhrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintref fen des Trigger, 
der das Ausfuhrungsende des Zyklus anzeigt, der emeute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausfuhren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaft, aber nicht 
zwingend 1st. 

45 Durch Ein tref fen eines Triggers (Trg-x) kann die Schleife termini ert werden. 
Existiert ein Eintrag fur Trg-x in der Obersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der tlbersetzungs- und Zuweisungsvorrichtung refer enzierte 
Konfiguration (KX) ausgefOhrt werden. 

Existiert kein Eintrag, kann durch das explizite Vexwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schleife zu bestimmte vorgegebenen Ausftihrungszeitpunkten termini ex t werden. 

Pigur 13 zeigt beispielhaf t einen Aufbau eines Konf igurationsbusses zur 
Konfiguration von PAEs (1001) durch eine Konfigurationseinheit (0106). Die 
Konfigurationseinheit sendet Konfigurationsdaten tiber ein Bussystem 1301 und 

10 ggf . Ober mehrere Registers tufen (1303, 1304) zur Verbesserung des 

Frequenz vernal tens und Ober den Konfigurationsdatenbus (0404) an die PAEs 
1001. Jede PAB dekodiert die angel egt en Adressen und reagiert, sofern sie 
selektiert wurde, auf die Datenubertragung des Busses. PAEs konnen ihrerseits 
Da ten Ober 0404 ttber die Regis ter-Multiplexer-Stuf en 1304 auf das Bus system 

15 aufschalten und die Konfigurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch Ubertragung der Adresse der Empfangs einheit. 
Die RUckubertragung der Da ten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls durch Registerstuf en hindurch (1305) , bis zum Dateneingangsbus der 
Konfigurationseinheit (1302) . 

20 Die Funktionsweise des Konf igurationsbusses ist ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of fenbaxungszwecken volluraf anglich 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf indungsgemaSen FIFO -Model Is zur Steuerung 
25 der Rekonf iguration; hiexbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befahigung zur Durchf uhrung von Sprungen das hier prasentierte 
Fifo-Modell von rein en Fifos aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vora typischen, sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren last, Diese Einheit ist optional zu alien, insbesondere den 
in dies ex Anmeldungen beschxiebenen, rekonf iguierbaren Zellen (PAEs) und in 
Figur 4 als Einheit 0406 dargestellt. 

Ein Speicher 1401 en thai t die Konfigurationsdaten fur die zugeordnete PAE. 
1402 ist der Konfigurationsdatenausgang zu den Konf igurationsregi stern der 

35 PAE (0405). Ober 1403, d.h. den Bus 0404, schreibt die Konfigurationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang urn den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell . Ein Startadress-Pointer (1404) zeigt auf den erst en 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu abertragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder Datenubertragung aus 
dem Speicher an die PAE urn den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die Datenubertragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, bei spiel sweise 
anhand eines CycleBits oder Befehls (WAIT, END) . 

51 



WO 03/036507 



PCT/EP02/10572 



Der realisierte FIFO entspricht nicht den normal en FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufweisen. Die Modif ikation erm5glicht das 
Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch benOtigte Konf igurationsdaten 
5 uberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Startadress-Pointers 1404 mit dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konfigurationseinheit zuruckgewiesen, dies kann bevorzugt durch das aus 
P ACTIO bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konfigurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicher inhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
en thai t 5 Konf iguxationen (C0..C4). 1404 zeigt als S tar tpo inter auf die erste 
15 Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konf iguration G3 . Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konfiguration CO plus der Lange der Konfiguration CI plus 
der Lange der Konfiguration C2. 

20 Eingehende Trigger (1431) werden Ober eine in Figur 14a dargestellte 

tfbersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SC0..n, 
1433) ttbersetzt, die die Adressierung der Konf igurationsdaten im Speicher 
steuern. Diese Obersetzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vomehmen, ist aber bevorzugt wahrend der Abarbeitung einer 

25 Konfiguration veranderlich, wozu geeignete Rttckkopplungen, Signal lei tungen 
etc. vorzusehen sind. Besonders wenn die tJbersetzungs- und 
Zuweisungseinrichtung veranderlich ist, wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wahrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind entsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
insbesondere programmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere prograramgesteuerte Veranderung ist auch fur die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel mttglich. Die diese 
Aktualisierung und/oder neue Vernal tensweisen ausltfsenden Befehle werden 

35 bevorzugt in der Speichereinheit 1401 hierfur abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaf t realisiert durch eine bitweise Und -Funk tion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Olied verwaltet den 

40 Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konfigurationen im Speicher 1401. Mit anderen worten 
wird entsprechend des Bei spiels 1408 das erste Glied die Lange der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
urn auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Lange der 

45 Konfiguration CI auf, also den offset der auf den Offset von CO und auf 1404 
addiert werden muss, um auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die Lange der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert werden muss, um auf die 
Konflguration C3 2u zeigen. Und so welter. 

Es wird anhand der Aus fanning ersichtlich, dass eine Kette von Additionen 

en ta tent, deren Gliederanzahl der Position der Konf iguration im Speicher 
5 entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 

Uber den Addierer wir jewel Is der im Register gespeicherte Wert, also die 
: Lange der jeweiligen Konflguration, zu dem Ergebnis des vorherigen Gliedes 

dazuaddiert . Der Wert am Eingang der bitweisen Und- Function wird mit alien 

Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 
10 die Und-Funktion eine Binare 0 am Ausgang, um die Addierer kette bei der 

auszuwahlenden Konflguration abzubrechen, ansonsten den Wert des 

Addierersausgangs . 

Mit anderen Wort en ist in die Register (1411) die GrBSe der Konfigurationen 
15 in ihrer Reibenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
der art auf die Null -Generator en gefuhrt, dass die Konf igurations-GroSen bis 
zur Startadresse der durch die Trigger (1431) referenzierten Konflguration 
auf addiert werden. 

20 Somit addiert die Kette alle Langen von Konfigurationen, die vor der zu 

ladenden Konflguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konflguration zeigt. 

25 Die beschriebene Schaltung ist besonders leistungsfahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes ermOglicht. 

In einer zweiten optionalen Kette (1421) kttnnen in Registern (1422) Befehle 
an die Konfigurationseinheit und/oder die PAE und/oder den 

30 Konfigurations stack gespeichert werden. Eine Nullfunktion (1423), hier 

ebenfalls beispielhaft entsprechend der Nullfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, so fern das Selekt- Signal nicht aktiv 1st, 
d.h. die Konflguration nicht ausgewahlt wurde, ansonsten den Registerinhalt 
(1422), also den Befehl. Uber eine Oder-Kette (1424) werden alle Null- 

35 Funktionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selekt ier ten Konflguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum L0schen von BintrSgen im Speicher (1401) dienen, 
d.h elner der mfiglichen Befehle kann sein, dass bestimmte gespeicherte 

40 Konfigurationen gelOscht werden sollen bzw. zum Oberschreiben f reigegeben . 
Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Startzeiger (1404) 
mit dem Iiesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum Uberschreiben freigibt. Dies ist insofern bevorzugt, als die so zu 
ttberschreibenden Konfigurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daher typisch uberschrleben werden kOnnen, wahrend die jttngeren 

Konfigurationen, die oftmals noch bentttigt werden r welter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt Implementierter 

53 



WO 03/036507 



PCT/EP02/10572 



Befehl ist, class neue Konf igurationen geladen werden soli en; dies 1st dann 
wichtig, wenn das Erfordernis, eine bestimmte neue Konf iguration zu 
benotigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine zentrale 
5 Konf igurationsverwaltungseinheit oder dergl. abgegeben warden; die 
Direktladung ist gleichfalls mflglich, etwa bei Zuordnung von I/O- 
Moglichkeiten . Auch ist es bevorzugt, wenn sowohl der 
Konf iguration .q an f orderungsbef ehl als auch der Plush- bzw. 
Al tkon f igur a tionspreis gabebe f ehl si mult an ausfuhrbar und/oder speicherbar 
10 sind. Es sei erwahnt, dass derartige Befehle wie Flush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbax sind und dafur nicht zwingend eine dedizierte Einheit wie 1421 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwaremaSig bevorzugt sein. 

15 

Weiterhin kann der Befehl uber das Bussystem nach Figur 13 an die 
Konf igurat ions einheit gesendet werden (1426). Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konf iguration auslOsen und/oder das Vor laden 
einer Konf iguration bewirken. 

20 

FLUSH, also das Loschen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fur die Ausfuhrung, andererseits weist er das Problem auf , dass sich bei 
dessen Ausfuhrung samtliche Adressen und Referenzen verandem. 

25 Der FIFO wird "gef lushed* , indem der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespeicherten Konf iguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung mittels des Offsets bestimmt wird. 
Alternativ oder zusatzlich kann der Zeiger auch auf einen bestimmten anderen 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin mussen die beiden Ketten 1414 und 1421 "gef lushed* werden, damit 
die Adressberechnung der geanderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451), durch die die Regis terdaten der art 

35 vorwartsttbertragen werden, dass die nunmehr leeren ( "gef lushten* ) Glieder der 
Kette mit den Daten der nachfolgenden Glieder uberschrleben werden, und zwar 
der art, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt und 
b) das erste Glied der Kette mit neuen Daten bei eg t ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Lucke in die Glieder nachf olgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass uber die Multiplexer 1451 auch Daten betreffend die Konf igurationsgrofce 
von aufien an die entsprechenden St ell en (Size of Config l..n) geschrieben 
werden kdnnen. Es ist dabei abzusch&tzeh, aber aus GrQnden der 
Zeichnungsubersichtlichkeit nicht dargestellt, dass jede S telle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird ins owe it auf die in 1434 
dargestellte Einheit 1435, die diese S telle jeweils bestimmt. 
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Durch die Verschiebung innerhalb der Ketten sind nunmehr die Selekt-Signale 
(SC0..n) an die neue Lage der Daten in den Ketten an zupas sen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of f setberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur VerfQgung. Beispielsweise 
5 kOnnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Plush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) um die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mitt els einer Lookup-Tabelle auf die Selekt- 
Signale 1433 ubersetzt werden. Dazu 1st die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten an zupas sen. 

15 Bin besonders bevorzugtes Verfahren fur die Obersetzung der Signale soil 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung: 

Ein erstes Schieberegister (1435) enthalt als einen Ein-Bit-Wert die Position 
des aktuell erst en freien, also unbenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht folgendermafien: Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt (dargestellt durch einen 
geftlllten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Olied 
in den Ketten referenziert . Mit jedem Schreibzugrif f auf die Ketten, also mit 
jedem neuen speichem (FILL) einer Konf iguration nach 1401 schiebt das 

25 Schieberegister das gesetzte Bit (PBIT) um eine Position in Richtung des 

hSchstwertigen Bits und referenziert damit auf das jeweils nachfolgende Olied 
in den Ketten. Das h&chstwertige Bit referenziert somit auf das h6chste Glied 
In den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 

30 (PBIT) um genau so viele Posit ionen wie Glieder in den Ketten gelOscht wurden 
in Richtung des niederwertigen Bits. 

Die fltoersetzungs- und Zuweisungseinrichtung (1432) ubersetzt bei der PAE vom 
Bus system (0105a, Fig. 4) eingehende Trigger der art, dass je Trigger ein 

35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben GrCSe wie 1435 zugeordnet. Bs sind also 
eine Vielzahl von Schiebergistem 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maximal zulassigen 
unterschiedlichen Triggersignale entspricht und deren Lange d.h. Bitbreite 

40 der Anzahl der maximal zulassigen Konfigurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beim neuen Speichem einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete. Trigger 
zeigt; dargestellt durch einen Kreis. 

45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

ubersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert liefern. Die Signale 1437 werden jeweils an Mullgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und-Funktion gefuhrt. Alle Nullgeneratoren 
deren Eingangs signal von X437 einen 0-Wert aufweist, liefern einen Nullvektor 
am Aus gang. Der Nullgenerator, dessen Eingangs signal von 1437 einen 1-Wert 
aufweist, ubertragt den Inhalt des Schieberegisters 1436. Die Ausgange aller 
5 Nullgeneratoren werden miteinander verodert (1439), sodass die Selekt-Signale 
SC0..n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger uber die 
Nullfunktionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einem Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeicherten Wert urn genau so viele Positionen, wie Glieder in den 
Ketten geloscht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT uber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vormals 
referenzierte Konf iguration geiescht wurde. 

Liefert 1434 fur einen eingetrof fenen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konf igurationsauf forderung an die Konfigurationseinheit zu 
send en, um die fehlende Konf iguration zu laden oder ggf . auch ein 
Fehl era tatus an die Konfigurationseinheit zu melden. 

Die Obersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erf olgend, die einzeln oder gemeinsam angewendet werden 
kSnnen, beispielsweise: 

1. Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACT10) 

3. Lookup-Tabelle (vgl. PACT10) 

30 Prinzipiell kann die Obersetzung dem in PACT10 beschriebenen Verfahren 
entsprechen (Round-Robin-Arbiter, LOT1). 

Fehlt eine Obersetzungsvorschrift, beispielsweise bei der Anwendung von 
Lookup-Tabellen, ist eine Konfigurationsaufforderung an die 
Konfigurationseinheit zu senden, um die. fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlers tatus an die Konfigurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurations stacks nach Figur 14 ist 
das Sequenzen uber Konfigurationen, was bedingte und unbedingte Sprunge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbefehle in 
Konfigurationsworten (1402) beiro Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin 1st als Konstante ein Vergleichswert (1469) mit den eintreffenden 
Triggern oder den Statusflags der PAE, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags full, empty, etc., 
angegeben, in Abhangigkeit dessen bedingte Sprtlnge durchgefuhrt werden. Diese 
5 wird an eine Vergleichseinheit 1464 ttbermittelt, die den Wert mit den Flags 
(1465) und/oder Triggern, die von dem Augang ttbersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bus system 0105 stairanen, 
verglichen . 

10 Eine Steuereinheit (1466) . generiert in Abhangigkeit des Befehles (bedingter 
oder unbedingter Sprung = "Type") und des Vergleichsergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wie folgt: 

Unbedingter Sprung: Generiere "Set", urn neue Adresse nach 1405 zu laden; 
Bedingter Sprung, Verglaich erf ttllt : Generiere "Set", urn neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, vergleich nicht erf ullt : Generiere "Count", um Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. tfber einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konf igurationen (1461) auswahlt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepo inter 1405 geschrieben. 

25 Die Arbeitsweise des Konf igurations tacks macht die Verwendung von 

Konfigurationseinheiten (CT) wie aus PACT10 und PACT17 bekannt weitgehend 
oboslet, vielmehr ist eine verteilte, parallele CT durch die 
Konf igurationss tacks ents tanden . 

Zwei Aufgaben der CT k8nnen dabei jedoch bei einer solchen Einheit 
30 verbleiben: 



1. Das Laden der Konf igurationen aus ein em Speicher, der chipintem oder 
-extern implementiert sein kann, als flttch tiger oder nicht fluchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 

35 und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Mikrokontroller erfolgen, der Da ten an die PAEs sendet und 
auf die zuruckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT 05 beschriebene Algorithmus eingesetzt werden. Das Laden roufi nicht 

40 mehr zwingend aktiv geschehen, sondern es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konfigurationsanforderungskommando 
das Hereinholen der neuen Konf igurationsda ten in die jeweilige PAE 
bzw. der en zugeordneten Konf igurationsspeicher veranlasst. Dies kann, 
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etwa bei den vorstehend disku tier ten I/O-PAEs auch jene PAE selbst 
sein, die derzeit neue Konf igurationsdaten benatigt. 



2. Die verbleibende Resteinheit kann verwendet werden, urn 
5 sicherzustellen, daes Reconfigurations trigger (WCT) in einer 

bestinmaten Reihenfolge sortiert durch das Array lauf en und/oder 
vorgeladene Konf igurationen in der erf order lichen Reihenfolge 
abgearbeitet werden und/oder noch nicht geladene, aber benGtigte 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 

10 Diese Reconfigurations triggerpriorisierung kann dazu verwendet werden, 

zu Priorisieren, auf welchen Rekonf igurationsanforderungstrigger 
zuerst reagiert werden soil. Dies stellt die konfliktfreie Abarbeitung 
unterschiedlicher, mSglicher Konf igurationen sicher, indem lediglich 
festgelegt wird, welcher Trigger zunachst durch das Array lauft. Wenn 

15 ein solcher Trigger eine bestimmte PAE be tr if ft, die auf dies en 

Trigger reagieren soil, wird sie sich dies merken, um dann als 
nachetes auf die sen Trigger reagieren zu konnen, sobald sie 
rekonf iguierbar ist. Es sei erwahnt, dass bevorzugt die einzelne Zelle 
oder ein Zellgebilde oder dergl. riicht nur jene Trigger vormerkt, die 

20 unmittelbar nachfolgend abzuarbei tende Konf igurationen betreffen, 

sondern dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kOnf tig abzuarbei tenden Konf igurationen in ihrer Reihenfolge 
abgelegt werden kGnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhait und behait, 

25 die sie zuktinf tig und/oder aktuell betrifft. Damit wird die Filmo- 

Funktion der fruheren CT ttberflttssig und durch den Zeitverlauf der 
Triggervektoren iiu wesentlichen ersetzt. 



3. Sofem nur ein Rekonf igurationstrigger verwendet wird, sind keine 
30 besonderen MaSnahmen erforderlich. Wenn mehrere 

Rekonf igurationstrigger (WCT) auf tret en k6nnen, mussen diese ohne 
zeitliche uberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array lauf en, um Deadlocks zu verhindern. 

35 Die kann durch das in Figur 16 dargestellte Verf ahren sichergestellt werden, 
bei welchen durch Routing-Ma fin ahmen fur eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fur 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfemungen der 1601 in der 

40 Matrix fuhren zu unterschiedlichen Lauf zei ten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelinestuf en 
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(1602) durch den, dem Compiler zugeordneten Router, erreicht (vgl. PACT13) . 
Die sich dadurch ergebenden Latenzen sind mit dl-d5 angegeben. Es ist 
ersichtlich, da£ in Richtung des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
5 die Entfernung von 1606 von 1603 sehr gering ist. Da aber fur 1607 und 1608 
je ein 1602 aufgrund der durch die langere Distanz entstehenden Laufzeit 
eingeftigt werden mug, wird 1605 zum Abgleich der Laufzeit notwendig. 
Die zentrale Instanz 1603 nimmt von den PAEs eingehende 

Rekonfigurations trigger (1609) auf und priorisiert diese, urn sie dann jeweils 
10 einzeln und nacheinander als WCT an das Array aus PAEs zu senden. Mit 

anderen Worten sendet eine PAE, die ein en Rekonfigurations trigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondern ausschliefilich an die 
zentrale Instanz 1603. 

15 Die zentrale Instanz speichert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACT10 bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACT10 ausftthrlich beschrieben ist. 
Samtliche erwahnten PACT-Schutzrechte sind zu Of fenbarungszwecken 
vollumfanglich eingegliedert . 
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Titel: 
5 Patentansp ruche 

1. Zellementefeld zur Datenverarbeitung mit Funktionszellen zur AusfOhrung 
algebraischer und/oder logischer Funktionen und Speicherzellen, urn 
Information zu empf angen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzeichnet , dafi von den Punktionszellen eine Steuerverbindung zu den 

Speicherzellen geftthrt 1st. 

2. Zellementefeld nach dem vorhergehenden Anspruch , dadurch gekennzeichnet , 
daS ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzahl in Punk t ion und/oder Verne tzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Funktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 
gekennzeichnet, dafi die Funktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
dafi die arithmetischen Logikeinheiten als erweiterte ALOs gebildet sind. 

25 5. Zellementefeld nach einem der vorhergehenden Ansprttche, dadurch 

gekennzeichnet, dafi die Speicherzellen zur fluchtigen und/oder nicht 
fluchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Da ten und/oder von zu verarbei tenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, dafi die 
35 Speicherzellen dazu ausgebildet sind, abgespeicherte Informations auf 

Ansteuerung der sie steuemden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle fuhrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Ansprtlche, worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Informationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 

45 gekennzeichnet, dafi die Speicherzelle dazu angeordnet ist, Infonnationen 

von der sie steuernden Funktionszelle, einer Kingabe-Ausgabe-Zelle 
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und/oder einer sie nicht steuexnden Zelle mit arithmetischer Logikeinheit 
zu empfangen. 

10. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dafi der Funktionszellen-Speicherzellen-Kcmbination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet 1st, urn Informatioaen an eine 
externe Einheit und/oder eine andere Funkt ions zelle, Funktionszellen- 
Speicherzellen-Kombination und/oder Speicherzelle zu senden und/oder von 
dieser zu empfangen. 

11. Zellementefeld nach dera vorhergehenden Anspruch, dadurch gekennzeichnet , 
daS das Ein-Ausgabe-Mittel gleichfalls zum Eropfang von Steuerbefehlen 
aus der Funktionszelle ausgebildet 1st. 

Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dafi die Steuerung dazu ausgebildet 1st, zumindest 
einige, bevorzugt alle der nachfolgenden Befehle zu fiber tragen und/oder 
die Speicherzelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet 1st, die 
folgenden Befehle zu dekodieren: DATA WRITE/READ, ADRESS POINTER 
WRITE/READ, PROGRAMMPO INTER WRITE/READ, PROGRAMMPO INTER INCREMENT, 
STACKPO INTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fur 
internen und/oder extern en Zugriff , PUSH, POP, OPCODE, FETCH. 

Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dafi die Funktionszelle als alleiniger Master auf die 
Steuerverbindung und/oder das als Steuerungsverbindung dienende 
Buesegment zugreifen kann. 



15 12. 



20 



13. 

25 



14. Zellementefeld zur Datenverarbei tung nach einem der vorhergehenden 
Anspruche, dadurch gekennzeichnet, dafi die Funktionszelle zumindest 
einer von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet ist. 



15. Zellementefeld nach einem der vorhergehenden AnsprQche, dadurch 
gekennzeichnet, dafi die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Ein-Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren zum Betrieb eines Zellelementef eldes , insbesondere 
multidimensional en Zellelementef eldes mit Funktionszellen zur Ausftihrung 
algebraischer und/oder logischer Funk ti on en und 

Informationsbereitstellungszellen, insbesondere Speicher zellen und/oder 
45 Bin-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen 

und/oder Speichem derselben, dadurch gekennzeichnet, dafi zumindest eine 
der Funktionszellen Steuerbefehle an zumindest eine 
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Informationsbereitstellungszelle ausgibt, dort im Ansprechen auf die 
S t eu er be fehl information fQr die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet ist, eine weitere Datenverarbeitung im 
Ansprechen auf aus der Infonnationsbereitstellungszelie bereitgest elite 
5 Information durchzuf tihren , urn so sequenzerartig Daten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, dafi die Funktionszelle dazu ausgebildet ist, zumindest 

einige der Steuerbefehle 
10 OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 

DATA READ INTERN, 

DATA READ EXTERN, 
15 ADRESS POINTER WRITE INTERN, 

ADRESS POINTER WRITE EXTERN, 

ADRESSPO INTER READ INTERN, 

ADRES S POINTER READ EXTERN, 

PROGRAMMPO INTER WRITE INTERN, 
20 PROGRAMMPO INTER WRITE EXTERN, 

PROGRAMMPO INTER READ INTERN, 

PROGRAMMPO INTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPO INTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbefehle wie erforderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensional en 
35 Feld 

in Funk t ion und/oder Verne tzung konf igurierbarer Zellelemente und 
dies en zugeordneten Konfigurationsvorhaltemitteln zum lokalen 

Konf igurations-Vorhal ten, 

dadurch g e k e n n z e i c hn e t , daS 
40 die Konf igurati onsvorhalt emit t el dazu ausgebildet sind, 

zumindest einen Teil der vorgehaltenen Konf igurationen 

nichtflUchtig vorzuhalten. 

19. Datenverarbeitungsanordnung mit einem multidimensional en 
45 Feld 

in Funk t ion und/oder Verne tzung konf igurierbarer Zellelemente und 
dies en zugeordneten Konfigurationsvorhaltemitteln zum lokalen 
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Konf igur at ions -Vorhal ten , 
dadurch g e Jcenn z e i c hne t , daS 
die Konf igurationsvorhal tend tt el dazu ausgebildet sind, 
alle vorgehaltenen Konf igurationen 
5 nichtfluchtig vorzuhalten. 

20. Datenverarbei t lings anordnung nach einem der vorhergehenden 
Datenverarbei timgsanordnungsanspruche, dadurch gekennzeichnet, daft die 
Funktion grobgranular konf igur ierbar ist. 

10 

21. Datenverarbei tungsanordnung nach einem der vorhergehenden 
Datenverarbei tungsanordnungsanspruche , dadurch gekennzeichnet, dafi die 
Vemetzung grobgranular kon f i gur i erbar ist. 

15 22. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS als 
Zellelemente zumindest eines von ALUs, EAlTJs, RAM-Zellen, I/O-Zellen, 
LogiblScken vorgesehen sind. 

20 23. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbei tungsanordnungsanspruche, dadurch gekennzeichnet , daS jedem 
Zellelement ein eigenes Konfigurationsvorhaltemittel zugeordnet ist. 

24. Datenverarbei tungsanordnung nach einem der vorhergehenden 

25 Datenverarbei tungsanordnungsanspruche, dadurch gekennzeichnet, daS die 

Konfigurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25. Datenverarbei tungsanordnung nach einem der vorhergehenden 

30 Datenverarbei tungsanordnungsansprQche, dadurch gekennzeichnet, dafi 

mehrere fest vorgegebene nichtfluchtige Konf igurationen im 
Konfigurationsvorhaltemittel vorgegeben sind. 

26. Datenverarbei tungsanordnung nach einem der vorhergehenden 

35 Datenverarbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi die 

Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu vexwenden , insbesondere im Wege der 
Wave-Rekonfiguration Oder des lokalen Sequencing. 

40 27. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsanspruche, dadurch gekennzeichnet, dafi bei 
einigen Zellen im Betrieb mit ver ander 1 ichen Konf igurationen versehbare 
Konfigurationsvorhaltemittel vorgesehen sind. 

45 2 8. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsanspruche, dadurch gekennzeichnet, dafi als 
Konfigurationsvorhaltemittel zunmindest eines aus ROM, KPROM, EEPROM, 
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Flash-Speicher, Fuse-, Antifuse-programmierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur fest vorgesehene 
Speichermittel gewahlt sind. 

5 29. Verf ahren zur Hers t el lung einer dedizierten 

Datenveraxbei tungsanordnung , dadurch gekennzeichnet , daS ein 
multidimensionales Feld mit in Funktion und/oder Verne tzung 
konf igurierbaren Zellelemente und dies en zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konfigurations-Vorhalten 

10 vorgegeben wird, bestimmt wird, welche Konfigurationen in diesen 

vorzuhalten sind, und dann nichtf luchtige Konf igur at ions vorhaltemittel 
so vorgesehen werden, dafi sie zumindest einen Tell der vorgehal tenen 
Konfigurationen nichtf luchtig vorhalten. 

15 30, Verf ahren nach dem vorher g ehenden Da tenver arbei tungsanordnungsanspruch , 
dadurch gekennzeichnet, dafi von ein em zur lauf zeitrekonf igurierbaren 
multidimensionalen Feld ausgegangen wird. 

31. Verf ahren nach dem vorhergehenden Datenveraxbei tungsanordnungsanspruch, 
20 dadurch gekennzeichnet, dafi zunachst von ein em zur 

lauf zeitrekonf igurierbaren raultidimensionalen Feld mit 
Rekonf igurationsbeschaltung ausgegangen wird und dann fur 
Rekonfiguration nichtbendtigte Felder weggelassen werden. 

32. Da tenver arbei tungsanordnung, insbesondere nach einem der vorhergehenden 
25 Anspruche, insbesondere Prozessor, mit einem Feld aus zur Lauf zeit in 

Funktion und/oder Vernetzung da tenver abeitenden rekonf igurierbaren 
Zellen, den en speicher und eine Sequenzersteuerung zugeordnet ist, 
dadurch gekennzeichnet, dafi die Steuerung derart ausgebildet ist, dafi 
sich ein vollstandiger und/oder limitierter Befehssatz ergibt. 

30 

33 . Datenverarbei tungsanordnung, insbesondere nach einem der 

vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung da t enver abe i t enden 
35 rekonf igurierbaren Zellen, mit einer ALU oder anderen logischen 

Verkntlpfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, dafi der Speicher in 
einer anderen Halbl ei ter -Lage , insbesondere oberhalb der ALU oder 
anderen logischen Verkntip f ungsbes chal tung angeordnet ist. 

40 

34. Datenverarbei tungsanordnung, insbesondere nach einem der 

vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung dat enver abei t enden 
rekonf igurierbaren Zellen, von denen einige Speicher zwecken dienen, 
45 dadurch gekennzeichnet, dafi diese Zellen dazu ausgebildet sind, eine 

MMU und/oder DMA - Funktion zu realisieren. 
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10 



15 



35. Da t enverarbe i tungs anordnung , insbesondere nach e in era der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Peld aus 
zur Laufzeit in Funktion und/oder Verne tzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, daE wenigstens 
eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs/Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen Verknupfungsbeschaltung zur 
Da t enverarbe i tung und/oder -veranderung aufweisen, wobei insbesondere 
Mittel vorgesehen sind, urn jedem EinganGs- und/oder Ausgangskanal eine 
definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsraittel vorgesehen sind. 

36. Da tenverarbei tungs anordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, dafi zumindest 
einige, bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Da tenverarbei tungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konfigurationseinheit zur schnellen Rekonfiguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, daS die Konfigurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen zur Verarbeitung von Daten mit einer hoheren 
Bitbreite, dadurch gekennzeichnet, daS die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer hSheren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 

39. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, daS zur Zelle hin oder von dieser weg ftthrende Busse 

40 teilbar sind, insbesondere urn mehrere Datenstrome mit geringerer 

Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig weiterleiten und/oder empfangen zu kcnnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 

45 vorhergehenden Anspruche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, dafi die Bus verwal tung lokal in der Zelle erfolgt. 
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41. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet, dag einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und die Adressbusse als 
Teiladresbusse aufteilbar sind. 



42. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet, dafi einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen 
10 ist, um bei Zugriff auf eine Speicher s telle sowohl Inf orroationen 

betref fend die Adresse einer Speicher s telle fur den nachsten 
Speicher zugriff zu bestimmen als auch Daten und/oder Befehle zu 
ermitteln. 
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